Python下载法兰克福证券交易所文件失败怎么办?(法兰克福.证券交易所.失败.文件.下载...)

wufei1232025-03-08python5

python下载法兰克福证券交易所文件失败怎么办?

解决Python下载法兰克福证券交易所文件失败问题

许多开发者在使用Python下载网络文件时,可能会遇到从blob URL下载文件失败的情况。本文以法兰克福证券交易所的Excel文件下载为例,详细说明如何解决此问题。

问题描述: 直接使用urllib或wget库从法兰克福证券交易所下载文件(例如,“主数据”文件),下载的文件大小异常小且内容无法读取。这是因为原始URL指向一个blob URL,它并非指向实际文件,而是浏览器中的一个数据块。

解决方案: 问题根源在于服务器在未识别用户代理的情况下拒绝了访问请求。解决方法是模拟浏览器请求,伪造一个用户代理。

以下提供Python 3和Python 2的解决方案代码:

Python 3 代码:

import urllib.request as request

url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/all-tradable-etfs-etcs-and-etns.xlsx'
# 模拟Safari浏览器用户代理
headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'}
req = request.Request(url, headers=headers)
with request.urlopen(req) as response:
    file_content = response.read()
    # 将文件内容写入本地文件
    with open('downloaded_file.xlsx', 'wb') as f:
        f.write(file_content)

print("文件下载成功!")

Python 2 代码:

import urllib2

url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx'
# 模拟Safari浏览器用户代理
headers = {'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'}
req = urllib2.Request(url, headers=headers)
with urllib2.urlopen(req) as response:
    file_content = response.read()
    # 将文件内容写入本地文件
    with open('downloaded_file.xlsx', 'wb') as f:
        f.write(file_content)

print("文件下载成功!")

通过添加User-Agent头部信息模拟浏览器请求,从而绕过服务器限制,成功下载文件。 代码中已将print(f.read())修改为将文件内容写入本地文件downloaded_file.xlsx,避免直接打印到控制台。 请注意,如果目标URL发生变化,需要更新代码中的URL。

以上就是Python下载法兰克福证券交易所文件失败怎么办?的详细内容,更多请关注知识资源分享宝库其它相关文章!

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。