C# pdfbox解析pdf文字及图片(源码)

时间:2014-06-30 04:23:50
【文件属性】:

文件名称:C# pdfbox解析pdf文字及图片(源码)

文件大小:6.82MB

文件格式:RAR

更新时间:2014-06-30 04:23:50

pdfbox 提取文字 提取图片 C#解析pdf

最近项目使用C#解析PDF,此程序主要利用PDFBOX提取PDF中文字及图片。C#解析PDF相关资料太少了,研究了好多天,现在放上来,希望朋友们少走些弯路。适用于未加密的PDF。


【文件预览】:
PDFParser
----PDFParser.sln(1KB)
----PDFParser()
--------bin()
--------PDFParser.csproj(2KB)
--------obj()
--------PDFParser.cs(8KB)
--------Properties()
----PDFParser.suo(23KB)
----PDFParseTest()
--------bin()
--------Form1.Designer.cs(4KB)
--------Program.cs(473B)
--------obj()
--------Form1.cs(2KB)
--------PDFParseTest.csproj(4KB)
--------Form1.resx(6KB)
--------Properties()

网友评论

  • 可以使用,里面涉及道德功能也的确是不少,需要时间学习
  • 凑合着用吧,说明不清晰。
  • 可以的,可以用的,就是图片太不准确了。
  • 这个非常不错,可是有点慢
  • 还是有些问题的 部分可用
  • 非常好的demo,3q
  • 不错,可以正常使用
  • 很不错,谢谢,代码使用中
  • 还不错,能用。
  • 不错,可以获取文字,但是就是获取的文字都累积在一起,不好解析。
  • 不错,正是我需要的
  • 使用过,图片怎么打不开,大小都是0,郁闷
  • 文字可以 。图片不太准确
  • 没有解决中文的问题,中文需要针对控件打个补丁,可惜没有做~
  • 还是有些问题的,望作者可以稍加修改就更完美了。。。不过还是暂时能解决问题的。。。
  • 可以正常解析。就是少文档。好多不清楚怎么使用
  • 很好很强大,谢谢,学习中……
  • 不错,很有用
  • 能读出图片,可惜图片属性已改变,我需要读取原图片
  • 运行一次后就不能使用了,不知道什么原因。中文识别很差,这个我查过了,本身这个控件就是这样,没办法的。
  • 没多大实用价值
  • 文字可以 。图片不太准确
  • 英文的可以读出来,但是中午的根本就不行, 查了查资料,据说是字库的问题
  • 貌似还不太完美,很多功能需要自己去封装一下
  • 读图片有问题 ,经常就是一个报错,读出来的图片也不是完整的,都不知道是哪里的一片一片的
  • 能解析的PDF版本不多,不过自己修改一下,勉强可以达到我的使用需求了,还是要多多参考,其他的PDF文档才行。
  • 很好,能用 ,感谢你的分享
  • 很差很差,千万不要下载,文字也读不出,图片也读不出,运行时,点击读取文字提示:未能加载文件或程序集“bcprov-jdk14-132,Version=0.0.0.0”,还搞这么多分才能下载,想分想疯了
  • 不错。选择用了。
  • 下载的文件在哪?找不到啊。