我经常有难同当的逻辑或配置更新以意想不到的方式是打破脆弱的旧版网站的工作。
我没有创建所需的系统的时间或知识硒脚本。 此外,我不想检查特定使用案例 - 我想验证网站上的每一个环节和页面。
我想创建一个自动化系统的测试,将通过网站蜘蛛检查链接是否损坏和崩溃。 理想的情况下,将有一个工具,我可以用它来实现这一目标。 它应该有尽可能多的以下特征,按降序优先顺序:
- 通过脚本触发
- 不需要人机交互
- 下面的各个环节,包括锚标签和链接到CSS和JS文件
- 产生的日志,找到的所有404,500S等。
- 可以在本地部署来检查内网网站
- 支持的Cookie /基于表单的认证
- 自由/开源
有许多局部的解决方案在那里,像FitNesse中 , Firefox的和linkchecker和W3C的链接检查 ,但他们没有做我需要的一切。
我想用这个测试使用了一系列的技术和平台项目,所以更便携的解决方案更好。
我知道这是正确的系统测试不可替代的,但如果我核实,没有网站的部分明显破损的方便和自动化的方式,它是非常有用的。
我用的Xenu的链接猎犬对于这样的事情。 快速检查没有deadlinks等上一个/任何网站。 就在任何URI指向它,它就会蜘蛛在该网站上的所有链接。
从现场Desription:
的Xenu的链接猎犬(TM)检查网站断开的链接。 链接验证是“正常”的链接,图片,框架,插件,背景,局部影像图,样式表,脚本和Java小程序来完成。 它显示你可以按照不同的标准进行分类的URL的汽车无更新列表。 报告可以随时产生。
它符合所有你的要求除了是编写脚本,因为它是一个Windows应用程序,需要手动启动。
我们使用和真的很喜欢和linkchecker:
http://wummel.github.io/linkchecker/
这是开源,Python和命令行,在内部展开,并输出到各种格式。 开发者非常有帮助的时候,我们已经联系了他的问题。
我们有一个Ruby脚本,查询我们的内部网站的数据库,揭开序幕和linkchecker为每个站点相应的参数,并解析这和linkchecker给我们创造我们的CMS每个站点的自定义错误报告中的XML。
哪一部分你的清单中没有的W3C链接检查不符合? 这将是一个我会用。
另外, 斜纹 (基于Python的)是这种事情一个有趣的小语言。 它有一个链接检查模块 ,但我不认为它的工作原理递归,所以这不是对蜘蛛那么好。 但是,如果你舒服,你可以修改它。 我可能是错的,有可能是一个递归选项。 值得一试,反正。
您可能需要使用wget此尝试。 它可以蜘蛛在内的“必要条件页”(即文件)的一个网站,并可以被配置为记录错误。 我不知道这是否会为您提供足够的信息,但它是免费的,并适用于Windows(Cygwin的),以及UNIX。
InSite的是一个商业计划,似乎做你想要的(没有用它)。
如果我是你的鞋子,我可能会写这种蜘蛛的自己...
我不知道它支持形式的认证,但它会处理Cookie,如果你能得到它要去的网站上,否则我认为Checkbot会做你的清单上的一切。 我已经使用在构建过程中的步骤前检查,没有什么在网站上破。 这里有一个输出例如在网站上。
我一直很喜欢linklint用于检查一个网站的链接。 不过,我不认为这符合所有的标准,特别是各方面,可能是JavaScript的依赖。 我也认为这将错过CSS里面叫做图像。
但对于蜘蛛所有锚,它的伟大工程。
尝试SortSite 。 这不是免费的,但似乎做一切你需要和更多。
另外, PowerMapper从同一家公司也有类似的,但是,不同的方法。 后者会给你自己网页的详细的优化信息较少,但仍然会发现任何损坏的链接,等等。
免责声明:我在公司,使这些产品的财务权益。
尝试http://www.thelinkchecker.com它是一个在线应用程序,检查外向链接,网页排名,锚,出站链接数的数量。 我觉得这是你所需要的解决方案。