文件名称:code-completion
文件大小:4.57MB
文件格式:ZIP
更新时间:2024-05-09 15:29:40
Python
代码完成 该存储库包含有关培训和评估用于预测Python(也可以使用其他编程语言)代码的语言模型的源代码。 1.查询Python存储库 使用大约5 GB的Python源文件对本文中使用的模型进行了训练。 要获取GitHub上的Python存储库列表(仅具有> = 100星),请在上执行以下SQL查询(更改表名称中的日期以获取最新数据): SELECT repo . name , MAX ( CAST(JSON_EXTRACT_SCALAR( payload, ’$. pull_request . base . repo . stargazers_count ’ ) AS INT64) ) stars FROM ‘ githubarchive . month . 202012 ‘ WHE
【文件预览】:
code-completion-dev
----cc_constants.py(439B)
----cc_utils.py(8KB)
----visualization-tokenizer.ipynb(75KB)
----cc_datasets.py(5KB)
----cc_unittests.py(1KB)
----cc_server.py(2KB)
----repositories-202103.csv(7.07MB)
----cc_models.py(5KB)
----cc_train.py(19KB)
----cc_tokenizers.py(14KB)
----LICENSE(1KB)
----cc_train_tokenizers.py(9KB)
----repositories.csv(1.66MB)
----cc_samplers.py(3KB)
----cc_clean_dataset.py(6KB)
----requirements.txt(132B)
----.gitignore(137B)
----cc_configuration.py(4KB)
----README.md(3KB)