如何在Scrapy使用PROXY_LIST与密码?(How to use PROXY_LIST wi

2019-09-28 01:52发布

我需要使用不同的代理,以避免被禁止。

我读了这个问题,并且这一个

我把我的代理人在proxylist.txt

http://xx.xx.xxx.xxx:port
http://xxx.xxx.xx.xxx:port
http://xx.xx.xxx.xxx:port
http://xxx.xxx.xx.xxx:port

,我把它在custom_settings

class MyClass(scrapy.Spider):
    reload(sys)
    sys.setdefaultencoding('utf8')
    start_time = time.time()
    name = 'mySpider'
    custom_settings = {
        'ROBOTSTXT_OBEY'    : 'False',
        'RETRY_TIMES'       : 10,
        'PROXY_LIST'        : 'proxylist.txt',
        'PROXY_MODE'        : 0,
        'DOWNLOADER_MIDDLEWARES' : {
            'scrapy.downloadermiddlewares.retry.RetryMiddleware': 90,
            'scrapy_proxies.RandomProxy': 100,
            'scrapy.downloadermiddlewares.httpproxy.HttpProxyMiddleware': 110,
            'scrapy_crawlera.CrawleraMiddleware': 600,
            'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None,
            'random_useragent.RandomUserAgentMiddleware': 400
        },
    }

这个版本的工作时,我的代理人没有密码

现在我有每个代理的密码,我能怎样改变与密码的工作?

Answer 1:

我回答我的问题。

我用这个和它的作品:

http://USERNAME:PASSWORD@PROXYIP:PROXYPORT


文章来源: How to use PROXY_LIST with password in Scrapy?
标签: proxy scrapy