five

doejn771/code_x_glue_ct_code_to_text_java_python

收藏
Hugging Face2024-12-03 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/doejn771/code_x_glue_ct_code_to_text_java_python
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含与代码库相关的信息,主要字段包括代码库名称、路径、函数名、原始字符串、编程语言、代码、代码标记、文档字符串、文档字符串标记、SHA值和URL。数据集分为训练集、验证集和测试集,分别包含416743、19097和25873个样本。该数据集可能用于代码分析、文档生成或自然语言处理任务。

This dataset contains information related to code repositories, with main fields including repository name, path, function name, original string, programming language, code, code tokens, docstring, docstring tokens, SHA value, and URL. The dataset is divided into training, validation, and test sets, containing 416743, 19097, and 25873 samples respectively. This dataset may be used for code analysis, documentation generation, or natural language processing tasks.
提供机构:
doejn771
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作