3 个解决方案
#1
最近在看设计模式,觉得再设计模式上楼主可以采用“生成器模式”。
可以将抽取姓名,抽取学历等对所有文件都用到的方法抽象出来放到接口。
然后根据不同文件实现接口中的方法,最后将数据都统一成同一种格式。最后在处理。
楼主说到的成功解析率应该是看各个文件解析的实现吧。
先编个原型出来,就先解析word的吧
应该是对关键词的优化吧?姓名性别就不说了,光工作经历这个就有工作经验,实习经历,等许多说法。
所以对于这个关键词也是建议单独抽出来放在配置文件内,首先方便更新,二来可以复用。
另外技术还有有一定限制的,细到一定程度成本就太高了。
以上个人愚见。希望能帮到你。
可以将抽取姓名,抽取学历等对所有文件都用到的方法抽象出来放到接口。
然后根据不同文件实现接口中的方法,最后将数据都统一成同一种格式。最后在处理。
楼主说到的成功解析率应该是看各个文件解析的实现吧。
先编个原型出来,就先解析word的吧
应该是对关键词的优化吧?姓名性别就不说了,光工作经历这个就有工作经验,实习经历,等许多说法。
所以对于这个关键词也是建议单独抽出来放在配置文件内,首先方便更新,二来可以复用。
另外技术还有有一定限制的,细到一定程度成本就太高了。
以上个人愚见。希望能帮到你。
#2
楼上的,你说的一大推的屁话。
#3
我也遇到同样的问题,现在解决了吗?能否指点一下,QQ在线:791882772
#1
最近在看设计模式,觉得再设计模式上楼主可以采用“生成器模式”。
可以将抽取姓名,抽取学历等对所有文件都用到的方法抽象出来放到接口。
然后根据不同文件实现接口中的方法,最后将数据都统一成同一种格式。最后在处理。
楼主说到的成功解析率应该是看各个文件解析的实现吧。
先编个原型出来,就先解析word的吧
应该是对关键词的优化吧?姓名性别就不说了,光工作经历这个就有工作经验,实习经历,等许多说法。
所以对于这个关键词也是建议单独抽出来放在配置文件内,首先方便更新,二来可以复用。
另外技术还有有一定限制的,细到一定程度成本就太高了。
以上个人愚见。希望能帮到你。
可以将抽取姓名,抽取学历等对所有文件都用到的方法抽象出来放到接口。
然后根据不同文件实现接口中的方法,最后将数据都统一成同一种格式。最后在处理。
楼主说到的成功解析率应该是看各个文件解析的实现吧。
先编个原型出来,就先解析word的吧
应该是对关键词的优化吧?姓名性别就不说了,光工作经历这个就有工作经验,实习经历,等许多说法。
所以对于这个关键词也是建议单独抽出来放在配置文件内,首先方便更新,二来可以复用。
另外技术还有有一定限制的,细到一定程度成本就太高了。
以上个人愚见。希望能帮到你。
#2
楼上的,你说的一大推的屁话。
#3
我也遇到同样的问题,现在解决了吗?能否指点一下,QQ在线:791882772