文件名称:nl2ml-mirror:NL2ML-项目
文件大小:2.15MB
文件格式:ZIP
更新时间:2024-05-03 16:26:31
JupyterNotebook
源代码分类 这是高等经济学院(HSE LAMBDA)大数据分析方法实验室的自然语言机器学习(NL2ML)项目的回购。 该项目的官方回购存储在GitLab(HSE LAMBDA库) - 项目的完整描述存储在概念-https: 该项目的实验存储在DAGsHub- //dagshub.com/levin/source_code_classification 项目目标 短期目标 建立一个对源代码块进行分类的模型,并指定检测到的类在块中的确切位置(标签分段)。 长期目标 通过获取简短的原始英语任务作为输入来构建模型生成代码。 资料库描述 该存储库包含项目团队一直在使用的工具,以用知识图顶点标记源代码块,并训练模型以识别将来的这些顶点。 通过知识图顶点,我们指的是ML管道的基本部分。 当前最新版本的知识图包含以下高级顶点: ['import', 'data_import', 'data_exp