multiuser_prodigy:为一组注释者运行 Prodigy

时间:2024-06-18 05:00:33
【文件属性】:

文件名称:multiuser_prodigy:为一组注释者运行 Prodigy

文件大小:365KB

文件格式:ZIP

更新时间:2024-06-18 05:00:33

spacy prodigy HTML

multiuser_prodigy 这是的多注释器设置, 是 Explosion AI 的数据注释工具,它使用 Mongo DB 将注释任务分配给在单独端口上运行的不同 Prodigy 实例上工作的注释器。 此用例侧重于从使用 Prodigy 的注释者团队收集黄金标准注释,而不是 Prodigy 主要针对的主动学习、单注释者设置。 存储库中有一些注释接口示例,包括用于训练 NER 模型或使用文档上下文进行句子分类的注释者的代码。 每个注释器都在分配给他们的 Prodigy/端口上工作,并且一个新的DBStream类处理从 Prodigy 中提取分配给每个工作人员的示例。 我现在已将此设置用于三个主要的注释项目,但您需要修改代码才能使其也适用于您的项目。 Mongo 数据库 所有任务都存储在一个 Mongo DB 中,这允许将任务分配给注释者的不同逻辑。 例如,示例可以发送给注释器,直


【文件预览】:
multiuser_prodigy-master
----Report.html(851KB)
----multiuser_ner.py(3KB)
----multiuser_manual_db.py(7KB)
----Report.Rmd(8KB)
----mongo_load.py(852B)
----LICENSE(1KB)
----multiuser_db.py(4KB)
----mongo_delete.py(801B)
----multiuser_db_assault.py(7KB)
----README.md(3KB)
----multiuser_db_blocks.py(7KB)
----report_maker.py(1KB)
----multiuser_mark.py(5KB)
----custom_ner_manual.py(2KB)
----streamlit_dashboard.png(46KB)
----annotation_streamlit.py(1KB)

网友评论