【文件属性】:
文件名称:collectionJava源码-Data-Collection:使用Java源代码中的指标收集重构
文件大小:2.49MB
文件格式:ZIP
更新时间:2021-05-19 13:30:06
系统开源
集合Java源码机器学习用于软件重构
这个软件库包含了使用机器学习方法的数据采集部分推荐的软件重构,收集重构和非重构,以后用于有大量的各种指标来训练ML算法从Java源代码的实例。
快速开始
准备一个MariaDB实例并创建一个名称为refactoring_ai的数据库(如果您拥有docker的一种快速方法是:
docker
run
-p
127.0.0.1:3306:3306
--name
some-mariadb
-e
MYSQL_ROOT_PASSWORD=root
-d
mariadb默认凭据)
用依赖项构建jar:
./gradlew
quarkusBuild
在input.csv定义要挖掘重构的项目
开始挖掘:
java
-jar
java
-jar
build/datacollection-0.1.0-runner.jar
配置
可以使用环境变量来完成配置。
您也可以使用变量创建一个.env文件。
有关每个变量及其说明,请参见.env.example。
论文和附录
该文件可以在这里找到:
原始数据集可以在这里找到:
完整结果的附录可以在这里找到:
数据收集工具
依存关系
【文件预览】:
Data-Collection-master
----.gitignore(265B)
----projects()
--------android_repos.txt(1.54MB)
--------project_list_2_cleaned_noDup.csv(3.2MB)
----settings.gradle(228B)
----build.gradle(2KB)
----src()
--------main()
--------test()
----log-analyzer.sh(6KB)
----.dockerignore(71B)
----gradlew(6KB)
----LICENSE(1KB)
----.github()
--------workflows()
----README.md(4KB)
----gradlew.bat(3KB)
----gradle.properties(231B)
----input.csv(3.18MB)
----gradle()
--------wrapper()
----.env-example(1KB)