文件名称:keras_bert_text_classification:本项目采用Keras和Keras-bert实现文本多分类任务,对BERT进行微调
文件大小:6.22MB
文件格式:ZIP
更新时间:2024-04-24 15:14:24
Python
本项目采用Keras和Keras-bert实现文本多分类任务。 维护者 jclian91 数据集 sougou小分类数据集 sougou小分类数据集,共有5个类别,分别为体育,健康,军事,教育,汽车。 划分为训练集和测试集,其中训练集每个分类800条样本,测试集每个分类100条样本。 THUCNews数据集 使用THUCNews数据集进行训练与测试,10个分类,每个分类6500条数据。类别如下:体育,财经,房地产,家居,教育,科技,时尚,时政,游戏,娱乐数据集划分如下:训练集: 5000 * 10测试集:1000 * 10 代码结构 . ├── chinese_L-12_H-768_A-12(BERT中文预训练模型) │ ├── bert_config.json │ ├── bert_model.ckpt.data-00000-of-00001 │ ├── bert_model
【文件预览】:
keras_bert_text_classification-master
----model_train.py(5KB)
----data()
--------sougou_mini()
----model_evaluate.py(1KB)
----FGM.py(3KB)
----model_server.py(2KB)
----requirements.txt(61B)
----.gitignore(78B)
----model_predict.py(2KB)
----README.md(4KB)