文件名称:Snowball:对“ Snowball:从大型纯文本集合中提取关系”论文的扩展(Agichtein和Gravano,2000年)
文件大小:28KB
文件格式:ZIP
更新时间:2024-02-24 12:22:11
nlp information-extraction semi-supervised-learning tf-idf bootstrapping
雪球:从大型纯文本集合中提取关系 这是我自己的Snowball系统的实现,用于引导关系实例。 您可以在此处找到更多详细信息: Eugene Agichtein和Luis Gravano,《 。 在第五届ACM数字图书馆会议论文集中。 ACM,200。 H Yu,E Agichtein, 。 于生物信息学,19(增刊1),2003年-牛津大学出版社 可以包含已标记命名实体的句子的样本文件,该文件具有100万个句子,摘自English Gigaword Collection中的《纽约时报》文章。 注意:查看以了解如何提供带标签的文档集合和种子以使用Snowball设置关系实例的自举,这两个系
【文件预览】:
Snowball-master
----Snowball.py(14KB)
----Snowball()
--------VectorSpaceModel.py(1KB)
--------Tuple.py(5KB)
--------Seed.py(373B)
--------__init__.py(115B)
--------Sentence.py(7KB)
--------Pattern.py(5KB)
--------Config.py(5KB)
--------ReVerb.py(12KB)
----LICENSE(34KB)
----__init__.py(115B)
----README.md(1KB)
----parameters.cfg(1KB)