Python下载法兰克福证券交易所Blob URL数据时遇到问题怎么办?(法兰克福.证券交易所.数据.下载.Python...)

wufei1232025-03-08python3

python下载法兰克福证券交易所blob url数据时遇到问题怎么办?

解决Python下载法兰克福证券交易所Blob URL数据难题

许多Python用户在下载网络文件时,常遭遇Blob URL导致文件下载不完整或无法读取的问题。本文提供从法兰克福证券交易所网站下载“主数据(下载,xlsx)”Excel文件的Python解决方案。

问题:直接使用urllib或wget访问Blob URL,只会下载到289字节的不可读文件。这是因为服务器端设置了访问限制,未提供正确的用户代理信息时,返回错误信息而非实际文件。

解决方案:模拟浏览器行为,伪装成正常用户请求。在请求头中添加user-agent信息,欺骗服务器,使其认为请求来自浏览器,从而绕过访问限制。

以下代码分别提供Python 2和Python 3的解决方案:

Python 3:

import urllib.request as request

url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/all-tradable-etfs-etcs-and-etns.xlsx'
# 模拟Safari浏览器用户代理
user_agent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'
req = request.Request(url, headers={'User-Agent': user_agent})
with request.urlopen(req) as response:
    file_content = response.read()
    # 将文件内容写入文件
    with open('etf_data.xlsx', 'wb') as f:
        f.write(file_content)
    print("文件已成功下载到etf_data.xlsx")

Python 2:

import urllib2

url = 'http://www.xetra.com/blob/1193366/b2f210876702b8e08e40b8ecb769a02e/data/All-tradable-ETFs-ETCs-and-ETNs.xlsx'
# 模拟Safari浏览器用户代理
user_agent = 'Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25'
req = urllib2.Request(url, headers={'User-Agent': user_agent})
with urllib2.urlopen(req) as response:
    file_content = response.read()
    # 将文件内容写入文件
    with open('etf_data.xlsx', 'wb') as f:
        f.write(file_content)
    print("文件已成功下载到etf_data.xlsx")

代码中,我们使用user-agent模拟Safari浏览器请求。urlopen函数发送包含模拟用户代理的请求,从而成功下载文件。代码将下载的文件内容写入名为etf_data.xlsx的文件中。请注意,此URL的有效性取决于法兰克福证券交易所网站结构,未来可能发生变化。 建议使用更健壮的错误处理机制来处理潜在的网络错误。

以上就是Python下载法兰克福证券交易所Blob URL数据时遇到问题怎么办?的详细内容,更多请关注知识资源分享宝库其它相关文章!

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。