执行与cheerio刮下的JavaScript(Executing scraped JavaScri

2019-07-20 09:05发布

我有一个网页,其中有一些JS的API不改变的DOM,但返回一些数字。 我想编写一个应用程序的NodeJS是这样的下载页面中和下载页面的上下文中执行这些功能。

我一直在寻找cheerio的网页抓取..但同时,我看到的是多么容易浏览和操纵它的DOM,我没有看到运行的页面功能的任何访问。 是否有可能做到这一点?

我要看看,而是在jsdom?

谢谢

Answer 1:

Sounds like you want to use PhantomJS, which will provide the fully rendered output, and then use cheerio on that.



Answer 2:

Cheerio和jsdom都是HTML刮削器和没有执行JavaScript的概念。 如果访问您希望API是用JavaScript编写的,有一点要阻止你提取它们并运行它们的内部节点。 要小心的是,下载/执行任意JavaScript可能会带来巨大的安全隐患。 如果你想模拟浏览器的行为,看http://phantomjs.org/ 。 这是一个节点一个无头的浏览器,可以做一切普通的浏览器也可以。



文章来源: Executing scraped JavaScript with cheerio