PHP获取网页的内容(PHP Get contents of webpage)

2019-09-03 13:21发布

所以我使用PHP简单的HTML DOM解析器来获得一个网页的内容。 我知道我在做什么是对的,我还是得到了没有任何被发现的错误。

因此,这里是我使用的是看是否有什么实际被抓什么:

<?php
include_once('simple_html_dom.php');

error_reporting(E_ALL);
ini_set('display_errors', '1');

$first_url = "http://www.transfermarkt.co.uk/en/chinese-super-league/startseite/wettbewerb_CSL.html"; // works

$html = file_get_html($first_url);
echo "<textarea>Output\n===========\n $html</textarea><br /><br />";

$second_url = "http://www.transfermarkt.co.uk/en/chinese-super-league/torschuetzen/wettbewerb_CSL.html"; // does not work?

$html = file_get_html($second_url);
echo "<textarea>Output\n===========\n $html</textarea><br />";
?>

没有错误。 没有在第二个文本区域。 第二网址似乎没有被得到刮BT工具......为什么?

Answer 1:

simple_php_dom.php包含:

define('MAX_FILE_SIZE', 600000);
...
if (empty($contents) || strlen($contents) > MAX_FILE_SIZE)
{
    return false;
}

第二页是超过672000个字节,所以这个尺寸检查失败。 增加常数,你应该确定。



Answer 2:

我测试你的问题它的正常工作。 你必须检查的PHP内存限制它可能是问题

增加你的PHP内存限制,然后再试一次

<?php 

//use this to increase memory limit
ini_set('memory_limit', '200M');

$second_url = "http://www.transfermarkt.co.uk/en/chinese-super-league/torschuetzen/wettbewerb_CSL.html"; // does not work?

$html = file_get_contents($second_url);
echo "<textarea>Output\n===========\n $html</textarea><br />";


文章来源: PHP Get contents of webpage