文件名称:sparser:英语自然语言理解系统
文件大小:202.55MB
文件格式:ZIP
更新时间:2024-04-15 23:50:00
CommonLisp
介绍 Sparser是一个模型驱动的基于规则的语言文本分析系统,用于大量,高精度的信息提取。 从本质上讲,Sparser是一个自下而上的,基于短语结构的图表解析器,针对语义语法和部分解析进行了优化。 它具有基于重用数据结构资源的高效实现,以及不可磨灭的确定性解析算法和语法样式,使其能够在普通笔记本电脑上以每秒数千个单词的速度进行完整的语义分析。 另一种查看Sparser的方法是将其作为可配置的工具包,用于许多类型的文本处理。 替代配置由赋予大量参数的值定义。 这些规则控制允许哪些操作,使用什么数据结构,将加载哪些规则集,用于规则应用的协议,在扫描单词时执行的检查等等。 有多种配置可将Sparser变成多文档字频和TF / IDF制表符,这是一种由目标内容的语义模型驱动的高效信息提取引擎,浅层含义,本体归纳引擎或大型词典,语法驱动的阅读技术文献的系统 尽管语法和模型开发通常是在较小的文本上