解决Excel 2007的"有 XML 错误的 /xl/sharedStrings.xml"问题 (“发现不可读取的内容,是否回复此工作薄的内容...")

时间:2022-06-23 06:48:30
标签: xml  excel  2007  错误  sharedstring
原创作品,允许转载,转载时请务必以超链接形式标明文章  原始出处 、作者信息和本声明。否则将追究法律责任。 http://wandering.blog.51cto.com/467932/167861

昨天下班前,在关闭了辛辛苦苦编辑了一天的Excel 2007格式(.xlsx)文档时,心中掠过一丝阴影,重新打开文档,出现了下面的错误:
解决Excel 2007的"有 XML 错误的 /xl/sharedStrings.xml"问题 (“发现不可读取的内容,是否回复此工作薄的内容...")
 
 
选择“是”进行恢复,又出现了下面的错误提示,并且所有文字内容全部丢失了。
解决Excel 2007的"有 XML 错误的 /xl/sharedStrings.xml"问题 (“发现不可读取的内容,是否回复此工作薄的内容...")
 

接下来试了一些方法,没有成功,在网上搜索到了相似的案例,这可能还真是excel 2007的一个BUG,而且所有文章都没有给出解决方法,看来文件恢复的希望是没有了。
 
说说我都做了什么吧:
1)确认了自己使用的确实是.xlsx 文档 格式,从网上搜索的结果看是Microsoft的专有格式
2)Excel提供的修复方法仅仅是其程序自带的“内容恢复”
3)从网上查到了一篇文档,介绍了.xlsx文档的格式,知道了它其实是zip压缩了的xml文件集合
4)解压后查看 xl/sharedStrings.xml 文件内容,发现自己编写的内容还在。
5)直接用浏览器打开 xl/sharedStrings.xml 发现了这样的错误提示:
解决Excel 2007的"有 XML 错误的 /xl/sharedStrings.xml"问题 (“发现不可读取的内容,是否回复此工作薄的内容...")
6)意识到可能是<si></si>匹配对有缺失,通过对xl/sharedStrings.xml文件中的<si>和</si>分别进行文本查找,发现2者的数量相差1,</si>少了一个。
7)通过正则表达式替换、过滤得到下面结果,找到了</si>缺失的位置:
解决Excel 2007的"有 XML 错误的 /xl/sharedStrings.xml"问题 (“发现不可读取的内容,是否回复此工作薄的内容...")
8)到xl/sharedStrings.xml文件中,找到缺少</si>的<si>,手工补齐</si>。
9)用浏览器打开xl/sharedStrings.xml,不再提示错误。
10)把.xlsx的扩展名改为.zip,用Windows资源管理器打开,用修改后的xl/sharedStrings.xml替换旧文件,再把扩展名改回.xlsx。
11)再用excel 2007打开,所有数据恢复了。


---总结---
我遇到的这个错误的本质原因是xl/sharedStrings.xml文件中有不完整的<si></si>匹配对。其他朋友遇到相同的错误,不一定是与我相同的原因造成的。但找到问题原因的思路可以借鉴。希望这篇文档能够对大家有所帮助。


附:我现在改用openOffice编辑重要文档。


本文出自 “Wandering's Blog” 博客,请务必保留此出处http://wandering.blog.51cto.com/467932/167861