我想提取使用simplehtmldom类网页中的所有文本链接。 但我不想图片链接。
<?
foreach($html->find('a[href]') as $element)
echo $element->href . '<br>';
?>
上面的代码示出了包含href属性的所有锚链接。
<a href="/contact">contact</a>
<a href="/about">about</a>
<a herf="/home"><img src="logo.png" /><a>
我想要的只是/接触和/约不是/家,因为它包含了图像而不是文字的
<?php
foreach($html->find('a[href]') as $element)
{
if (empty(trim($element->plaintext)))
continue;
echo $element->href . '<br>';
}
<?
foreach($html->find('a[href]') as $element){
if(!preg_match('%<img%', $element->href)){
echo $element->href . '<br>';
}
}
?>
It is possible to do that in css and with phpquery as:
$html->find('a:not(:has(img))')
This is not a feature that will likely ever come to simple though.