dino:该存储库包含“使用预训练的语言模型生成数据集”的代码。

时间:2024-06-03 19:22:50
【文件属性】:

文件名称:dino:该存储库包含“使用预训练的语言模型生成数据集”的代码。

文件大小:14KB

文件格式:ZIP

更新时间:2024-06-03 19:22:50

Python

指令数据集(DINO :sauropod: ) 该存储库包含的代码。 本文介绍了从在structiø纳秒(DINO的方法称为d atasets :sauropod: ),使经过预训练的语言模型能够从头开始生成整个数据集。 :wrench: 设置 有关DINO的所有要求都可以在requirements.txt找到。 您可以使用pip install -r requirements.txt在新环境中安装所有必需的软件包。 :speech_balloon: CLI用法 单一文字 要为(单个)文本分类生成数据集,可以按以下方式使用DINO: python3 dino.py \ --output_dir \ --task_file \ --num_entries_per_label 其中是将生成的数据集写入其中的目录, 是包含任务规范的JSON文件(请参阅


【文件预览】:
dino-main
----.gitignore(81B)
----generation.py(13KB)
----requirements.txt(131B)
----task_specs()
--------sts-x1.json(473B)
--------sts.json(587B)
----modeling.py(12KB)
----utils.py(4KB)
----README.md(5KB)
----dino.py(9KB)

网友评论