我有一个网页,其中有一些JS的API不改变的DOM,但返回一些数字。 我想编写一个应用程序的NodeJS是这样的下载页面中和下载页面的上下文中执行这些功能。
我一直在寻找cheerio的网页抓取..但同时,我看到的是多么容易浏览和操纵它的DOM,我没有看到运行的页面功能的任何访问。 是否有可能做到这一点?
我要看看,而是在jsdom?
谢谢
我有一个网页,其中有一些JS的API不改变的DOM,但返回一些数字。 我想编写一个应用程序的NodeJS是这样的下载页面中和下载页面的上下文中执行这些功能。
我一直在寻找cheerio的网页抓取..但同时,我看到的是多么容易浏览和操纵它的DOM,我没有看到运行的页面功能的任何访问。 是否有可能做到这一点?
我要看看,而是在jsdom?
谢谢
Sounds like you want to use PhantomJS, which will provide the fully rendered output, and then use cheerio on that.
Cheerio和jsdom都是HTML刮削器和没有执行JavaScript的概念。 如果访问您希望API是用JavaScript编写的,有一点要阻止你提取它们并运行它们的内部节点。 要小心的是,下载/执行任意JavaScript可能会带来巨大的安全隐患。 如果你想模拟浏览器的行为,看http://phantomjs.org/ 。 这是一个节点一个无头的浏览器,可以做一切普通的浏览器也可以。