python3 zipfile解压出错_解决python3中解压zip文件是文件名乱码的问题

在zip标准中，对文件名的 encoding 用的不是 unicode，而可能是各种软件根据系统的默认字符集来采用(此为猜测)，因此zipfile中根据文件 flag 检测的时候，只支持 cp437 和 utf-8。具体就是查找 zipfile.py 源代码找到下面的代码：1: if flags & 0x800:2: # UTF-8 file names extension3: filen

weixin_39962394

309人浏览 · 2020-12-04 13:20:55

weixin_39962394 · 2020-12-04 13:20:55 发布

在zip标准中，对文件名的 encoding 用的不是 unicode，而可能是各种软件根据系统的默认字符集来采用(此为猜测)，因此zipfile中根据文件 flag 检测的时候，只支持 cp437 和 utf-8。

具体就是查找 zipfile.py 源代码找到下面的代码：

1: if flags & 0x800:

2: # UTF-8 file names extension

3: filename = filename.decode('utf-8')

4: else:

5: # Historical ZIP filename encoding

6: filename = filename.decode('cp437')

可见编码被正确识别为utf8时的情况外，都会被识别并decode为cp437编码，但如果实际是gbk等其他编码时就变为乱码了。所以解决的方法在于被decode为cp437后重新再手动转为正确的编码。

具体代码如下：

#修改代码

if flags & 0x800:

# UTF-8 file names extension

filename = filename.decode('utf-8')

else:

# Historical ZIP filename encoding

filename = filename.decode('cp437')

#修改

filename = filename.encode("cp437").decode('gbk')

后面一处同样如此修改

if zinfo.flag_bits & 0x800:

# UTF-8 filename

fname_str = fname.decode("utf-8")

else:

fname_str = fname.decode("cp437")

#修改

fname_str = fname_str.encode("cp437").decode('gbk')

亲测有效！

以上这篇解决python3中解压zip文件是文件名乱码的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

开放原子开发者工作坊

开放原子开发者工作坊旨在鼓励更多人参与开源活动，与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动，如meetup、训练营等，主打技术交流，干货满满，真诚地邀请各位开发者共同参与！

更多推荐

操作系统大会&openEuler Summit 2024参会指南，请查收！

开放原子开发者工作坊

推动工业软件核心技术攻关，开源工业软件算法集成大赛正式启动！

推动工业软件核心技术攻关，开源工业软件算法集成大赛正式启动！

开放原子开发者工作坊

第二届openEuler生态大会（中国·湖南）成功举办

10月30日，第二届openEuler生态大会（中国·湖南）成功举办。

开放原子开发者工作坊

所有评论(0)

查看更多评论

weixin_39962394

@weixin_39962394

已为社区贡献2条内容