PHP获取网页的内容(PHP Get contents of webpage)

所以我使用PHP简单的HTML DOM解析器来获得一个网页的内容。我知道我在做什么是对的，我还是得到了没有任何被发现的错误。

因此，这里是我使用的是看是否有什么实际被抓什么：

<?php
include_once('simple_html_dom.php');

error_reporting(E_ALL);
ini_set('display_errors', '1');

$first_url = "http://www.transfermarkt.co.uk/en/chinese-super-league/startseite/wettbewerb_CSL.html"; // works

$html = file_get_html($first_url);
echo "<textarea>Output\n===========\n $html</textarea><br /><br />";

$second_url = "http://www.transfermarkt.co.uk/en/chinese-super-league/torschuetzen/wettbewerb_CSL.html"; // does not work?

$html = file_get_html($second_url);
echo "<textarea>Output\n===========\n $html</textarea><br />";
?>

没有错误。没有在第二个文本区域。第二网址似乎没有被得到刮BT工具......为什么？

Answer 1:

simple_php_dom.php包含：

define('MAX_FILE_SIZE', 600000);
...
if (empty($contents) || strlen($contents) > MAX_FILE_SIZE)
{
    return false;
}

第二页是超过672000个字节，所以这个尺寸检查失败。增加常数，你应该确定。

Answer 2:

我测试你的问题它的正常工作。你必须检查的PHP内存限制它可能是问题

增加你的PHP内存限制，然后再试一次

<?php 

//use this to increase memory limit
ini_set('memory_limit', '200M');

$second_url = "http://www.transfermarkt.co.uk/en/chinese-super-league/torschuetzen/wettbewerb_CSL.html"; // does not work?

$html = file_get_contents($second_url);
echo "<textarea>Output\n===========\n $html</textarea><br />";

文章来源: PHP Get contents of webpage