文件名称:网页文本提取器
文件大小:12.73MB
文件格式:ZIP
更新时间:2015-12-03 15:45:19
网页 文本提取
批量提取HTML/DOC/RTF/TXT等文件中的文本信息。 支持从其它网站直接提取文本内容,生成所需数据库文件 支持GB2312/UTF-8多种编码 可将提取信息生成文本文件、HTM网页文件、MDB数据库文件。 提供多种查找、获取信息的方式: 提取文件中全部email邮件地址 提取文件中全部互联网址(无参数) 提取文件中全部互联网址(带参数) 提取HTML文件中body的文本内容 提取HTML文件中title与body的文本内容
【文件预览】:
@无法运行说明.txt
Readme-说明.htm
Fire_GetTxt
----favorite()
----LiuNu.Page.dll(2KB)
----Interop.ADODB.dll(616KB)
----IKVM.Runtime.dll(336KB)
----Interop.Excel.dll(924KB)
----office.dll(219KB)
----@无法运行说明.txt(1KB)
----msADOX.dll(196KB)
----LiuNu.Words.dll(3.28MB)
----Interop.Word.DLL(484KB)
----Microsoft.Vbe.Interop.dll(63KB)
----MSWORD9.OLB(536KB)
----IKVM.GNU.Classpath.dll(9.13MB)
----PDFBox-0.7.3.dll(4.44MB)
----License.txt(4KB)
----Interop.Microsoft.Office.Core.dll(400KB)
----MSWORD.OLB(650KB)
----config.ini(1KB)
----Microsoft.VisualBasic.dll(656KB)
----CodeFrameWork()
----ReadMe.txt(2KB)
----Interop.PowerPoint.dll(212KB)
----FontBox-0.1.0-dev.dll(84KB)
----fyp.ico(8KB)
----help.chm(36KB)
----Newtonsoft.Json.DLL(72KB)
----tutorial.url(95B)
----Interop.ADOX.DLL(36KB)
----VBE6EXT.OLB(44KB)
----FireAsp.mdb(268KB)
----Interop.ADODB64.dll(439KB)
----Interop.Office.DLL(152KB)
----RegSoft.txt(389B)
----Interop.XDICTGRB.dll(8KB)
----FireCodeCreator.exe(3.05MB)
----LiuNu.dll(840KB)