.Net c#使用PDFBox解析PDF文件

时间:2014-05-10 13:59:39
【文件属性】:

文件名称:.Net c#使用PDFBox解析PDF文件

文件大小:6.78MB

文件格式:RAR

更新时间:2014-05-10 13:59:39

.Net c# PDFBox PDF文件 解析

在.Net中使用PDFBox需要引用: 1.PDFBox-0.7.3.dlll (8 MB) 2.IKVM.GNU.Classpath (7 MB) 3.IKVM.Runtime.dll (360 kB) 4.FontBox-0.1.0-dev.dll 使用方法: private static string parseUsingPDFBox(string filename) { PDDocument doc = PDDocument.load(filename); PDFTextStripper stripper = new PDFTextStripper(); return stripper.getText(doc); }


【文件预览】:
src
----bin()
--------Debug()
----Pdf2Text.sln(899B)
----obj()
--------Debug()
--------Pdf2Text.csproj.FileList.txt(138B)
----Program.cs(602B)
----App.ico(1KB)
----Pdf2Text.csproj(4KB)
----AssemblyInfo.cs(2KB)

网友评论

  • 感谢分享,很实用
  • 可以打印 无水印
  • 文件少 运行不起来
  • 有些PDF格式提取不了 不好用
  • 可以使用,就是只能提取文本,图片就提取不了
  • 虽然没有用上,但是还是支持一样分享精神
  • 可以使用,就是只能提取文本,图片就提取不了了!
  • 纯文字的提取,不能提取图片
  • 咋不能解析图片呢
  • 只能纯文字的提取,不能提取图片
  • 网上都是这三行代码,不过我测试用的PDF 怎么只能读出一个换行符呢……奇怪
  • 不能正常使用,已经过期了的
  • 文件少 运行不起来
  • 可以用 但是 不支持图片啊
  • 不支持PDF图片中的文字,支持纯文字的提取。
  • 文件太多了,都不知道用哪是类库。
  • 这个我本地运行,报错。win7 vs 2008 sp1 的环境。
  • 可以解析pdf,不过对比较大的pdf解析会有错误
  • 不太适合俺用!
  • 文件不错,就是不知道是不是开源的
  • 不太适合我用,因为我想读取的文件含有图片,图片里面的文本读不出来
  • 可以正常解析。就是少文档。好多不清楚怎么使用
  • 可以用,帮助文档再多些就好了。
  • 可以,不过示例太少
  • 可以,不过示例太少,最主要不支持PDF图片提取
  • 有些东西不好使,不过还是谢谢了
  • 可以解析pdf文档,但是对于UniGB-UCS2-H编码的pdf文档不能解析,不知道有人解决没有?求好人告诉我解析UniGB-UCS2-H编码的pdf文档,联系QQ74182271
  • 可以解析,这个例子对于pdfbox的运用有了很好的解释
  • 不太适合我用,因为我想读取的文件含有图片,图片里面的文本读不出来
  • 还不错,可以作为参考