我正在学习用PHP的蜘蛛网站内容file_get_contents
,但有些事是wrong.The网我要的是“ http://www.jandan.net ”。
但使用file_get_content()
我得到的内容从“ http://i.jandan.net ”(它的电话页,它们是不同的页面)。 user_agent
也不能再用。
<?php
ini_set("user_agent","Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2) Gecko/20100301 Ubuntu/9.10 (karmic) Firefox/3.6");
$url = 'http://www.jandan.net/';
/*
$opt = array( 'http'=>array(
'method'=>"GET",
'header'=>"User-Agent: Mozilla/5.0\n"
)
);
$context = stream_context_create($opt);
*/
$content = file_get_contents($url);
echo var_dump($content);
?>
您在逗号$content = file_get_contents($url,);
是造成问题的原因。
-------------------------------------------------- ----------------------- ^
从原贴的代码 --- ^
保持逗号将产生以下错误信息:
解析错误:语法错误,意外“)”在......(文件夹路径等)
快速注 :使用$url = 'http://i.jandan.net/';
还努力,得到了内容显示。
尝试这个:
<?php
ini_set("user_agent","Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2) Gecko/20100301 Ubuntu/9.10 (karmic) Firefox/3.6");
$url = 'http://www.jandan.net/';
/*
$opt = array( 'http'=>array(
'method'=>"GET",
'header'=>"User-Agent: Mozilla/5.0\n"
)
);
$context = stream_context_create($opt);
*/
$content = file_get_contents($url);
echo var_dump($content);
// echo $content;
?>