我的目标是进入谷歌的搜索词后,从第一页的所有链接提取HTML。 我身后的代理工作,所以这是我的做法。
1.I首次使用机械化的形式输入搜索词,香港专业教育学院设置正确的代理服务器和机器人。
2.After提取的链接,使用的Ive全局urllib2.ProxyHandler,单独打开的网址所使用的开启器。
然而,这给了我这个错误。 没能弄明白。
urlopen error [Errno 8] _ssl.c:504: EOF occurred in violation of protocol
我的目标是进入谷歌的搜索词后,从第一页的所有链接提取HTML。 我身后的代理工作,所以这是我的做法。
1.I首次使用机械化的形式输入搜索词,香港专业教育学院设置正确的代理服务器和机器人。
2.After提取的链接,使用的Ive全局urllib2.ProxyHandler,单独打开的网址所使用的开启器。
然而,这给了我这个错误。 没能弄明白。
urlopen error [Errno 8] _ssl.c:504: EOF occurred in violation of protocol
而不是复制和编辑Python库模块,你可以通过重写SSL_VERSION关键字参数的SSL模块中的猴子补丁ssl.wrap_socket()。 可以用下面的代码原样。 在进行任何请求之前把这个在你的程序的开始。
import ssl
from functools import wraps
def sslwrap(func):
@wraps(func)
def bar(*args, **kw):
kw['ssl_version'] = ssl.PROTOCOL_TLSv1
return func(*args, **kw)
return bar
ssl.wrap_socket = sslwrap(ssl.wrap_socket)
它是一种已知的错误,怎么过了它的一些解决方案,在这个环节上的评论中提到。 看到这些,也许对你有所帮助, 错误的URL 。