code-corpora:用于文本分析的源代码语料库

时间:2024-06-01 22:03:10
【文件属性】:

文件名称:code-corpora:用于文本分析的源代码语料库

文件大小:43.71MB

文件格式:ZIP

更新时间:2024-06-01 22:03:10

Go

源代工厂代码语料库 用于文本分析的源代码语料库。 分析脚本和预烘焙结果 为了您的方便,此存储库中包含一些基本分析脚本和结果,请参见/ scripts。 / scripts / results中的结果每行显示一个结果,然后是绝对出现次数,以及出现总数的累计百分比。 此外,该列表被分成相同数量级的结果块。 提供以下报告: character.txt 计算每个字符的出现次数。 ASCII字符约占该代码集的99.9%。 pair_alphanumeric.txt 计算两个相邻字母数字字符的出现次数。 以下66对对的列表累计覆盖了约50%的代码集: in re er st on te at th es en se ti le nt or et he de ar co ct tr al ed io me is ta it as ra ri ng nd ec an to ns ro ne li


网友评论