【文件属性】:
文件名称:SOHU-baseline:搜狐校园算法大赛基线
文件大小:22KB
文件格式:ZIP
更新时间:2021-03-16 04:37:57
Python
SOHU基准
搜狐校园算法大赛基线
代码运行环境:
python 3.6
凯拉斯2.2.4
tqdm
界坝
张量流-gpu 1.12.0
整体思路:
采用管道的方式,将这个任务拆为两个子任务,先预测方面,根据方面预测情感极性(ABSA),这两个子任务都使用深度学习模型解决
方面预测采用指针标注的方式解决,标注aspect的头和尾,思路参考苏神在百度信息撷取的基准
根据aspect的情感分析是一个多分类问题,首先根据分隔符将文本拆分成多段,然后拆分aspect出现过的文本,再进行三分类
代码框架:
基线/:官方的基线
数据/:比赛的原始数据
log /:日志输出文件
ner /:训练ner模型的相关数据
output /:最终结果文件
sentiment_data /:训练情感分类模型的相关数据
w2v /:词向量
analysis.py:数据分析
ner.py:ner模型
ner
【文件预览】:
SOHU-baseline-master
----log()
--------README.md(2KB)
----ner_corpus.py(3KB)
----w2v_model.py(1KB)
----baseline()
--------README.md(2KB)
----sentiment_data()
--------README.md(2KB)
----data()
--------README.md(2KB)
----analysis.py(4KB)
----output()
--------README.md(2KB)
----ner_data()
--------README.md(2KB)
----w2v()
--------README.md(2KB)
----README.md(2KB)
----sentiment_model.py(10KB)
----sentiment_corpus.py(3KB)
----ner.py(10KB)