文件名称:Correlation-between-requirements-and-achievements:CCF BDCI 2019 “技术需求”与“技术成果”项目之间关联度计算模型 复赛B榜top1解决方案
文件大小:2.44MB
文件格式:ZIP
更新时间:2024-05-05 10:32:23
Python
2019 CCF BDCI “技术需求”与“技术成果”项目之间关联度计算模型第一名解决方案 赛题介绍 赛题介绍见 数据预处理 数据清洗 对技术成果和技术需求的较短内容进行筛选查看,发现其中存在一定量的空白、“\n”、“未提供。”等无用信息。使用对应标题对无用信息进行替换。 数据增广 对问题进一步化简,可以简化成两个文本之间的关联度计算。 1.那么A文本与B文本之间关联度,同样也是B文本与A文本之间关联度。该方法在仅取标题时可以提升成绩。当加入内容时会造成过拟合,最终未采用该方法。 2.那么假设A文本与B文本之间关联度为4,A文本与C文本之间关联度为3,那么可以假定B文本与C文本之间关联度为3,按照这个思路可以假设关联矩阵 其中A文本与B文本之间关联度为i,A文本与C文本之间关联度为j,那么B文本与C文本之间关联度为R_(i,j)。此方法可增加数据295994条,从中按照原数据集各个关联度等
【文件预览】:
Correlation-between-requirements-and-achievements-master
----preprocess()
--------preprocess.py(2KB)
--------input()
----model_save()
--------model_save.txt(0B)
----requirements.txt(97B)
----ckpt()
--------如果百度云下载过慢,该文件夹内容下载地址.txt(170B)
--------chinese_wwm_ext_L-12_H-768_A-12()
--------chinese_L-12_H-768_A-12()
----combine.py(1KB)
----train.sh(323B)
----log()
--------log.txt(0B)
----file()
--------2.png(4KB)
--------3.png(319KB)
--------5.png(333KB)
--------【2019 CCF BDCI】-关联模型-莽就完事了-说明论文.pdf(828KB)
--------6.png(323KB)
--------1.png(68KB)
--------4.png(332KB)
--------7.png(315KB)
----README.md(6KB)
----submit()
--------submit.txt(0B)
----input()
--------input.txt(0B)
----train.py(14KB)