文件名称:fasttext_experiments:用于文本分类的外部脚本
文件大小:7KB
文件格式:ZIP
更新时间:2024-04-15 23:02:46
Python
fasttext_experiments FastText是一种基于子词静态词嵌入的开源软件,可实现高效的文本分类。 它允许基于子词计算未知词的嵌入,并提供多标签分类。 还提供了在Common Crawl和Wikipedia上针对进行了预训练的单词嵌入。 该存储库包含一种基于模板生成句子的简便方法,该模板可用于使用FastText进行有监督的多标签学习。 有关更多信息,。 快速启动 git clone https://github.com/LAAS-HRI/fasttext_experiments.git ./install_dependencies.sh python generate_data.py --max_per_template 80 python train_and_evaluate.py 生成自己的数据 要生成自己的数据,您将需要2个文件: 包含每个类的个人(.cs
【文件预览】:
fasttext_experiments-master
----download_word_embeddings.sh(230B)
----templates.txt(1KB)
----requirements.txt(30B)
----README.md(1KB)
----generate_data.py(4KB)
----train_and_evaluate.py(1KB)
----.gitignore(2KB)
----install_dependencies.sh(39B)
----individuals.csv(1KB)
----build_vocab.py(2KB)