文件名称:SOHU-baseline:搜狐算法大赛(实体+情感)简单基准(比较容易理解)(使用lgb模型做二分类)
文件大小:2.63MB
文件格式:ZIP
更新时间:2024-04-05 03:55:24
JupyterNotebook
5月10日更新,初赛结束,总分排名6,应该进决赛了,比赛结束后会放出一个分数55+实体的单模代码 最终lgb代码: : SOHU基准 搜狐算法大赛(实体撤销+情感预测)的基准线〜 没有用深度模型,用的传统的lgb当成分类做的,这里的代码只用了一个非常基本的tfidf特征,模型构造好了,大家可以自己遵循自己的想法体现特征。 想先做实体的部分,就没做情感,可以加一个文件features / emo_features.py继续做,因为情趣正面感比例分解,可以直接全预测为POS。 跑代码前先把训练集和测试集放到/ data文件夹里 文件说明 先跑1.main_train_lmh.ipynb再跑1.main_test_lmh.ipynb models文件里是放训练好的lgb(也可以别的)模型的 功能里是放计算好的特征的 results提交的结果会放到这里,提交前打开答案,替换全部“为空就可以直
【文件预览】:
SOHU-baseline-master
----models()
--------model1.joblib(4KB)
----features()
--------x1.joblib(24KB)
--------y1.joblib(5KB)
----data()
--------stopwords.txt(18KB)
--------nerDict.txt(3.6MB)
----1.main_train_lmh.ipynb(5KB)
----1.main_test_lmh.ipynb(4KB)
----results()
--------result_1.txt(412B)
--------result_sample.txt(1.19MB)
----README.md(2KB)
----utils()
--------__pycache__()
--------features_ents.py(1KB)
--------ner.py(1KB)