文件名称:IdBench:评估源代码中标识符嵌入的基准
文件大小:447KB
文件格式:ZIP
更新时间:2024-06-01 10:51:00
JavaScript
基准 IdBench是一个基准,用于评估源代码标识符的词嵌入在多大程度上表示语义相关性和相似性。 数据集包含带有开发人员标记的相似性,相关性和上下文相似性等级的标识符对。 IdBench致力于提供黄金标准,以指导新型源代码嵌入的开发。 有关详细信息,请参见我们的: @InProceedings{IdBenchICSE2021, author = {Yaza Wainakh and Moiz Rauf and Michael Pradel}, title = {IdBench: Evaluating Semantic Representations of Identifier Names in Source Code}, booktitle = {IEEE/ACM International Conference on Software Engineering
【文件预览】:
IdBench-master
----small_pair_wise.csv(15KB)
----extractFromJS.js(5KB)
----compute_correlations.py(7KB)
----images()
--------example_indirect_survey.png(47KB)
--------instructions_direct_survey.png(196KB)
--------instructions_indirect_survey.png(65KB)
--------participants.png(42KB)
--------example_direct_survey.png(54KB)
----identifier_role_stats.csv(11KB)
----prepare_embedding_input.py(2KB)
----large_pair_wise.csv(20KB)
----extractorOfTokens.js(630B)
----jsExtractionUtil.js(7KB)
----README.md(7KB)
----train_w2v.py(2KB)
----pretrained_embeddings.py(2KB)
----medium_pair_wise.csv(18KB)
----identifier_cross_lang_freq_stats.csv(10KB)
----.gitignore(42B)