文件名称:aleph:基于词汇的命名实体识别
文件大小:748KB
文件格式:ZIP
更新时间:2024-06-21 19:17:17
Elixir
阿莱夫 aleph是一个基于词汇的命名实体识别模块:您阅读分层组织的词汇(即同义词库)和文本, aleph告诉您词汇中的哪些实体和概念出现在文本中。 需要在词库中以n3-或turtle-格式的读取; aleph为此使用模块。 使用优秀的 Erlang trie 实现,词汇表被转换成 PATRICIA 树。 使用 trie 使得无需使用词干提取或词形还原进一步预处理输入文本。 parseSKOS内置支持两个有据可查和精心策划的词汇:包括描述经济学领域的术语的和旨在描述计算机科学领域的。 例子 以下示例展示了如何使用您自己的和内置的词汇表。 假设,您想查找*关于计算机科学的文章第一段中提到的所有计算机科学相关概念: iex(1) > firstParagraph = " Computer science is the scientific and practical approa
【文件预览】:
aleph-master
----mix.exs(712B)
----config()
--------config.exs(1KB)
----stw.ttl(3.33MB)
----test()
--------aleph_test.exs(96B)
--------test_helper.exs(15B)
----mix.lock(207B)
----.gitignore(71B)
----lib()
--------aleph()
--------aleph.ex(23B)
----README.md(3KB)
----ccs.ttl(688KB)