我试图从提取信息, 在这里与Jsoup库。 不能抢JS元素之后的信息。
我看这个网页与Opera蜻蜓在每个TD元素上。 这里是结果:
<td class="t_port">
<script type="text/javascript">
//<![CDATA[
document.write(Socks^GrubMe^51959);
//]]>
</script>
"1080
"
</td>
当我的任何浏览器中使用视图代码函数,他返回我的代码,但没有“1080”同样的思路 - 什么我要找的信息。 当我试图抓住与Jsoup此页面相同的结果I'l服用。 js代码是多少或多或少相似。 喜欢:
document.write(SmallBlind^NineBeforeZero^64881);
要么
document.write(ProxyMoxy^DexterProxy^29182);
或类似的东西
document.write(Defender^Agile^57721);
了解这项服务的政策,我想这是什么JS代码块这个必要的信息并加载它动态地后,通过编辑DOM附加加入“1080”类型的信息。 任何建议抓住这个信息?
PS:这里是我的代码:
Document doc = Jsoup.connect(socks4URL).post();
Elements ips = doc.select("table.proxytbl td.t_ip");
for (Element e : ips) {
System.out.println("e is " + e.text());
}
Elements ports = doc.select("table.proxytbl td.t_port");
for (Element e : ports) {
System.out.println("port is " + e);
}