HTML Filter 是由北京红樱枫软件有限公司依据HTML Ver 4.01/CSS式样,研制和开发的MS Office系列文档到HTML转换的通用程序库。便于用户实现对多种文档的统一管理,编辑,检索和浏览,能够完美的实现文档附件在线预览功能。本产品采用了先进的多语言、多平台、多线程的设计理念,支持多国语言,多种操作系统,提供了多种形式的API功能接口,便于用户使用。用户可以方便的将本产品组装到自己的应用程序中。通过调用本产品的提供的API功能接口,实现MS Office系列文档到HTML的快速转换。
本产品在国内外得到了广泛的应用,在国内有腾讯、搜狐等多家知名企业使用本产品。对多种文档进行统一管理,编辑,检索和浏览。用户可以使用本产品,十分便利的将文档附件Word,Excel,PPT文档转换为HTML,通过浏览器浏览HTML的内容。本产品在性能和质量上都得到了用户广泛的好评。
例如邮件附件在线预览,就是当收到邮件带有文档附件时,尤其是超大附件,可以不用下载邮件中的附件,通过web页面,以在线的方式读取其中的内容。此功能方便用户直接查看附件,节省下载的时间,同时也在很多时候极大的方便了没有安装相应软件的用户,对于异地登录邮箱用户,更是一项不错的服务。
一、技术优势:
1.可以支持多种操作系统环境、支持服务器并发操作
支持各种操作系统,如:Linux32bit、Linux64bit 、Windows的32位和64位各种版本以及Sun SPARC版Solaris(32bit/64bit)、x86版Solaris10(64bit)、IBM AIX 5L、Macintosh等,并支持单线程或多线程操作,实现了多人共用机制。
2. 无与伦比的运行速度
程序全部用C/C++语言开发,执行速度无与伦比,即使是单线程运行,平均每秒钟处理9个文件,当50个线程时,每秒钟16个文件,随着线程数的增加以及机器性能的提高。是目前世界上处理文档效率最高的软件。
3. 对文件的操作不需要安装其他任何第三方软件
文件操作在数据转换过程中完全独立对文件格式进行分析转换,不需要安装生成文件的原软件。特别是不依赖于原软件的各种文档的Image化、PDF化技术,在网络服务器中的应用非常广泛。这是一项世界上比较流行、且需求量很大的技术。
二、产品功能介绍
1. 文件格式自动识别功能
本产品通过解析文件内部的信息,自动识别生成文件的应用程序名和其版本号,不依赖于文件的扩展名,能够正确识别文件格式和相应的版本信息。可以识别的文件格式如下所示 :
・ Microsoft Word 2007/2010
・ Microsoft Word 2003/XP/2001(mac)/2000/98(mac)/97/Ver.7(95)/Ver.6
・ Microsoft Excel 2007/2010
・ Microsoft Excel 2003/XP/2001(mac)/2000/98(mac)/97/7(95)/Ver.5/Ver.4
・ Microsoft PowerPoint 2007/2010
・ Microsoft PowerPoint 2003/XP/2001(mac)/2000/97/95
・ Microsoft RTF
・ PDF 1.0/1.1/1.2/1.3/1.4
・ 一太郎11/10/9/Lite/8/7/Ver.6.3/Ver.6/Dash2/Ver.5/Ver.4.3/Ver.4
・ OASYS V8/V7/V6/V5 分离型、结合型、复合型文件
・ OASYS Ver.4.1/Ver.4.0Ver.3.0a/Ver.3.0 分离型、结合型文件
・ OASYS V5/V6的on line形式
・ Lotus 1-2-3 R5J/97/98/2000/MillenniumEdition
・ HTML
・ AutoCAD GX-III/GX-5/R12/R13/R14/2000のDXF形式
・ AutoCAD GX-III/GX-5/R12/R13/R14/2000のDWG形式
・ IGES
・ Adobe PageMaker 6.0/6.5
・ ClarisWorks 4.0(WP、SS、DB)
・ AppleWorks 6(WP、SS、DB、DR、PR、PT)
・ XML
・ WordPerfect 7/8/9
・ Mac Write Ⅱ
・ Microsoft Works 2000(WP、SS、DB)
・ Corel Presentations 9
・ QuarkXpress 3.3/4
2. HTML转换功能
依据HTMLVer4.01 CSS Level2(Cascading Style Sheets)的式样说明,将指定的对象文件Microsoft Word,PowerPoint,Excel转换为HTML文件。
3. 支持的对象文件格式和版本
指定以下的文件格式,可以转换为HTML文件。
・ Microsoft Word 2007/2010/2013
・ Microsoft Word 2003/XP/2001(mac)/2000/98(mac)/97/Ver.7(95)/Ver.6
・ Microsoft Excel 2007/2010/2013
・ Microsoft Excel 2003/XP/2001(mac)/2000/98(mac)/97/7(95)/Ver.5/Ver.4
・ Microsoft PowerPoint 2007/2010/2013
・ Microsoft PowerPoint 2003/XP/2001(mac)/2000/97/95
4. 支持的浏览器种类
使用以下的浏览器,可以正常浏览转换的HTML文件。
・ Internet Explorer 9.0/10/11(Windows,Macintosh 共同)
・ Netscape 6.2以上(Windows,Macintosh 共通)
5. 支持的语言种类
・ 中文简体
・ 中文繁体
・ 英语
・ 日本语
・ 韩国语
6. 支持转换到HTML文件的字符集合的种类
转换HTML文件时,可以指定以下的字符集合作为HTML文件的字符集。
・ GBK
・ GB18030
・ Big5
・ Shift_JIS
・ EUC-JP
・ EUC-JP-FIX
・ ISO-2022-JP
・ KS X 1001
・ ISO-8859-1
・ ISO-10646-UCS-2
・ ISO-10646-UCS-4
・ UTF-16
・ UTF-8
三、HTML文件转换规格的说明
1. 文件名的规定
转换的HTML文件名默认使用原文件名。当原文件内有图像数据或指定CSS文件作为外部文件输出时,在HTML文件所在的目录下,生成文件夹,在该文件夹中保存图像文件、CSS文件。
2. 图像文件名的规定
image+编号.扩展名(扩展名为原数据中的图像的扩展名)
3. CSS文件明的规定
htmlFilter.css 为固定形式。
4. 关于图像转换
在HTML文件中可以使用的图像文件格式为GIF,JPEG和PNG。在Word,Excel,PowerPoint中保存了GIF,JPEG和PNG以外的图像,转换的HTML文件,可能无法显示。
本产品将Word,Excel,PowerPoint中的WMF和EMF形式保存的图像文件转换为Windows版的PNG形式。在Linux版和Solaris版中,无法进行图像文件的转换。因此,转换的HTML文件中的WMF、EMF图像文件无法显示。