Python下载法兰克福证券交易所文件失败怎么办?(法兰克福.证券交易所.失败.文件.下载...)
解决Python下载法兰克福证券交易所文件失败问题
许多开发者在使用Python下载网络文件时,可能会遇到从blob URL下载文件失败的情况。本文以法兰克福证券交易所的Excel文件下载为例,详细说明如何解决此问题。
问题描述: 直接使用urllib或wget库从法兰克福证券交易所下载文件(例如,“主数据”文件),下载的文件大小异常小且内容无法读取。这是因为原始URL指向一个blob URL,它并非指向实际文件,而是浏览器中的一个数据块。
解决方案: 问题根源在于服务器在未识别用户代理的情况下拒绝了访问请求。解决方法是模拟浏览器请求,伪造一个用户代理。
以下提供Python 3和Python 2的解决方案代码:
Python 3 代码:
import urllib.request as request url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/all-tradable-etfs-etcs-and-etns.xlsx' # 模拟Safari浏览器用户代理 headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'} req = request.Request(url, headers=headers) with request.urlopen(req) as response: file_content = response.read() # 将文件内容写入本地文件 with open('downloaded_file.xlsx', 'wb') as f: f.write(file_content) print("文件下载成功!")
Python 2 代码:
import urllib2 url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx' # 模拟Safari浏览器用户代理 headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'} req = urllib2.Request(url, headers=headers) with urllib2.urlopen(req) as response: file_content = response.read() # 将文件内容写入本地文件 with open('downloaded_file.xlsx', 'wb') as f: f.write(file_content) print("文件下载成功!")
通过添加User-Agent头部信息模拟浏览器请求,从而绕过服务器限制,成功下载文件。 代码中已将print(f.read())修改为将文件内容写入本地文件downloaded_file.xlsx,避免直接打印到控制台。 请注意,如果目标URL发生变化,需要更新代码中的URL。
以上就是Python下载法兰克福证券交易所文件失败怎么办?的详细内容,更多请关注知识资源分享宝库其它相关文章!