尝试(使用Python的urllib)从图像的URL凑图像,但得到的HTML代替(Try to sc

2019-10-22 12:16发布

我试图从以下网址获得图像。

http://upic.me/i/fj/the_wonderful_mist_once_again_01.jpg

我可以做单击鼠标右键,另存为,但是当我试图用urlretrieve像

import urllib
img_url = 'http://upic.me/i/fj/the_wonderful_mist_once_again_01.jpg'
urllib.urlretrieve( img_url, 'cover.jpg')

我发现它是HTML而不是.JPG图像,但我不知道为什么。 你能告诉我为什么我的方法不行? 有没有可以模仿任何选项,单击鼠标右键另存为的方法?

Answer 1:

您可以使用要求 ,如果你没有带装的是, pip install requests

因为这个img_url由服务器到另一个HTML页面重定向(这是您刚刚下载的HTML页面),如果你没有提供referer头。

所以,下面的代码先找到重定向URL,并将其添加到HTTP引用头。

import requests
img_url = 'http://upic.me/i/fj/the_wonderful_mist_once_again_01.jpg'

r = requests.get(img_url, allow_redirects=False)   #  stop redirect 302 , capture redirects url

headers = {}
headers['Referer'] = r.headers['location']    # add this url to referer 'http://upic.me/show/55132055'

r = requests.get(img_url, headers=headers)
filename = img_url.split('/')[-1]             # find the file name in `img_url`
with open(filename, 'wb') as fh:             # use 'wb' to write in binary mode
    fh.write(r.content)


Answer 2:

尝试这样的:

import urllib2

image = urllib2.urlopen('http://upic.me/i/fj/the_wonderful_mist_once_again_01.jpg').read()
f = open('some_name.jpg','w')
f.write(image)
f.close()


文章来源: Try to scrape image from image url (using python urllib ) but get html instead