python-docx使用document读取文件报错:docx.opc.exceptions.PackageNotFoundError: Package not found at
文章目录报错详情原因解决办法疑问报错详情原因执行到document=Document(word_path)时报错,python-docx模块无法读取该文件def open_file(word_path,excel_path,excel_sheet_name):#打开word文档document=Document(word_path)tables=document.tablestable_index
·
报错详情
原因
- 执行到
document=Document(word_path)
时报错,python-docx
模块无法读取该docx
文件
def open_file(word_path,excel_path,excel_sheet_name):
#打开word文档
document=Document(word_path)
tables=document.tables
table_indexs=len(tables)
#打开excel
wb=openpyxl.load_workbook(excel_path)
#打开表
sheet=wb[excel_sheet_name]
return tables,table_indexs,wb,sheet
解决办法
- 找到
win32com
将doc
转换为docx
的代码
def doc_to_docx(path):
if os.path.splitext(path)[1] == ".doc":
word = client.Dispatch('Word.Application')
doc = word.Documents.Open(path) # 目标路径下的文件
print("原始数据路径:"+os.path.splitext(path)[0])
doc.SaveAs(os.path.splitext(path)[0]+".docx",16) # 转化后路径下的文件
try:
print('保存文件')
doc.Close()
print('关闭Word.Application')
word.Quit()
except Exception as e:
print(e)
- 将
doc.SaveAs(os.path.splitext(path)[0]+".docx",16)
修改为如下代码
doc.SaveAs(os.path.splitext(path)[0]+".docx",12)
- 转换格式有问题导致
python-docx
读取docx
文件失败
疑问
- 在另外一台电脑上,
doc.SaveAs(os.path.splitext(path)[0]+".docx",16)
转换的格式未出现问题 - 在出问题的电脑上,使用
doc.SaveAs(os.path.splitext(path)[0]+".docx",16)
方式转换的docx
可以使用wps
正常打开
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
已为社区贡献2条内容
所有评论(0)