文件名称:bugrepo:公开的错误报告的集合
文件大小:146.35MB
文件格式:ZIP
更新时间:2024-05-21 18:05:30
nlp datasets bug-reports duplicate-detection
BugRepo BugRepo维护了一组错误报告,这些错误报告可公开用于研究目的。 错误报告是促进软件工程中基于NLP的研究的主要数据源。 我们将数据集分为以下研究方向。 1.重复的错误识别 项目 时间跨度 #组件 #问题 #问题/天 #重复 %重复 中位解析时间 1997/03/28〜2013/12/31 130 205,069 33.5 44,691 21.8% 102.1天 1999/07/30〜2013/12/31 52 115,814 22.0 35,814 30.9% 76.4天 2000/04/12〜2013/12/31 23 32,551 6.5 12,501 38.4% 83.7天 2001/10/10〜2013/12/30 21岁 85,156 19.1 14,404 16.9% 29.8天 2001/10/10〜201
【文件预览】:
bugrepo-master
----Firefox()
--------test.csv(1002KB)
--------mozilla_firefox.zip(33.15MB)
--------train.csv(2.99MB)
----README.md(12KB)
----JDT()
--------test.csv(118KB)
--------train.csv(499KB)
--------eclipse_jdt.csv(54.32MB)
----MozillaCore()
--------test.csv(522KB)
--------train.csv(3.36MB)
--------mozilla_core.zip(60.81MB)
----EclipsePlatform()
--------test.csv(228KB)
--------train.csv(980KB)
--------eclipse_platform.zip(26.23MB)
----Thunderbird()
--------test.csv(121KB)
--------train.csv(705KB)
--------mozilla_thunderbird.csv(35.4MB)