在网页抓取我想当前页面的HTML保存,以便以后的调试文件。 browser.html
有助于在大多数情况下,但是当页面包含的iframe /帧,它的内容不会返回browser.html
,我要的东西,如分别得到它browser.iframe.html
还有一些情况下,当一个iframe中是另一个iframe中。 我可以递归找到每一帧,并保存其内容,但分离文件将不会是非常有用的,因为我不知道该页面的确切结构。
例如,我有以下页面:
<!DOCTYPE html>
<html>
<head>
</head>
<frameset cols="50%,20%,30%">
<frame name="left" src="/html/left_frame.htm" />
<frame name="right" src="/html/right_frame.htm" />
<noframes>
<body>
Your browser does not support frames.
</body>
</noframes>
<frame src="http://example.com"/>
</frameset>
</html>
我要救它使用的Watir到文件。 有任何想法吗?