通过强制用户代理在Ruby中获得一个HTTPS网页的HTML源代码(Get HTML source

2019-10-17 05:01发布

>>require 'net/https'
>>uri = URI('https://www.facebook.com/careers/department?dept=product-management&req=a2KA0000000E147MAC')
>>conn = Net::HTTP.new(uri.host, uri.port)
>>req = Net::HTTP::Get.new(uri.request_uri, {'User Agent' => 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_6_8) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/21.0.1180.89 Safari/537.1'})
>>resp = conn.request req
=> #<Net::HTTPFound 302 Found readbody=true>

302重定向由网站抛出重定向到“支持的浏览器页面。 我在做什么错在设置用户代理这个请求? 我使用的是由浏览器返回相同的用户代理字符串。 附加信息:我不能使用库,比如在这个用例的Watir。 通过使用任何溶液的净/ HTTP [S]“或“开放-URI”将是真棒。

Answer 1:

更改“用户代理”到“用户代理”连字符。



文章来源: Get HTML source of a https page by forcing a user agent in Ruby