解决Excel的"有 XML 错误的 /xl/sharedStrings.xml"问题(修复EXCEL)

时间:2024-02-22 14:33:46

在关闭了辛辛苦苦编辑了一天的Excel 2007格式(.xlsx)文档时,心中掠过一丝阴影,重新打开文档,出现了下面的错误:

 
 
选择“是”进行恢复,又出现了下面的错误提示,并且所有文字内容全部丢失了。
 

接下来试了一些方法,没有成功,在网上搜索到了相似的案例,这可能还真是excel 2007的一个BUG,而且所有文章都没有给出解决方法,看来文件恢复的希望是没有了。
 
说说我都做了什么吧:
1)确认了自己使用的确实是.xlsx文档格式,从网上搜索的结果看是Microsoft的专有格式
2)Excel提供的修复方法仅仅是其程序自带的“内容恢复”
3)从网上查到了一篇文档,介绍了.xlsx文档的格式,知道了它其实是zip压缩了的xml文件集合
4)解压后查看 xl/sharedStrings.xml 文件内容,发现自己编写的内容还在。
5)直接用浏览器打开 xl/sharedStrings.xml 发现了这样的错误提示:
6)意识到可能是<si></si>匹配对有缺失,通过对xl/sharedStrings.xml文件中的<si>和</si>分别进行文本查找,发现2者的数量相差1,</si>少了一个。
7)通过正则表达式替换、过滤得到下面结果,找到了</si>缺失的位置:
8)到xl/sharedStrings.xml文件中,找到缺少</si>的<si>,手工补齐</si>。
9)用浏览器打开xl/sharedStrings.xml,不再提示错误。
10)把.xlsx的扩展名改为.zip,用Windows资源管理器打开,用修改后的xl/sharedStrings.xml替换旧文件,再把扩展名改回.xlsx。
11)再用excel 2007打开,所有数据恢复了。

---总结---
我遇到的这个错误的本质原因是xl/sharedStrings.xml文件中有不完整的<si></si>匹配对。其他朋友遇到相同的错误,不一定是与我相同的原因造成的。但找到问题原因的思路可以借鉴。希望这篇文档能够对大家有所帮助。

关于查找<si>和</si>配对的方法如下

关于楼主的第3)步,实际上需要先把原文件名由 *.xlsx改为*.zip,然后就可以看到 xl/sharedStrings.xml 文件了
关于楼主的第7)步,我是这么做的:
1 打开zip文件,找到sharedStrings.xml,双击打开(记事本),
2 将全部文本内容复制到Word中,
3 使用Word的查找替换功能,从第一行开始在所有的<si>和</si>前面添加回车符(替换<si>为^p<si>,替换</si>为^p</si>,注意从头开始,并且不要重复替换),
4 将Word中的全部内容复制到Excel表格中(使用选择性粘贴-文本),
5 现在每一个<si>和</si>都在单独的一行上,看一看</si>的行号,是不是从某一个位置开始,</si>的行号从单号变成了双号?恭喜你找到缺少</si>的行了!
6 根据上下文,找到记事本中的相应位置,补充缺少的</si>
OK !