三年java笔试题-CodeStylometry:程序员通过代码风格去匿名化

时间:2024-07-03 08:02:01
【文件属性】:

文件名称:三年java笔试题-CodeStylometry:程序员通过代码风格去匿名化

文件大小:7.34MB

文件格式:ZIP

更新时间:2024-07-03 08:02:01

系统开源

三年java笔试题SCAA 在 testCode 上运行 joern,将 joern-tools 脚本输出写入每个 testCode 文件的文本文件,从文本文件中提取特征以创建可在 WEKA 中用于机器学习的 arff 文件。 (这个项目需要 joern 和 python-joern 的开发分支,还需要设置 joern-tools。这三个 git 存储库有依赖关系,并带有完整的文档。) 对目录结构中的所有文件做预处理,year-> author name -> all_cpp_files_ofauthor run preprocessDataToTXTdepAST(filePath) in FeatureCalculators.java test_cpp_dir 有一个作者的所有cpp文件。 检查是否所有的 dep、txt 和 ast 文件都已正确创建。 (例如,如果 cpp 文件只有注释而没有代码,则 dep、txt 和 ast 文件将为空。从作者归属中排除此类情况。)如果您只想要语法特征,请确保在 joern-tools 中更改 astLabel .py 的行: if len(ch


网友评论