claudios/ds1000
收藏Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/claudios/ds1000
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是DS-1000的重新上传版本,元数据字典已被提取到列中,分类变量现在为`ClassLabel`类型,并且数据集原生为parquet格式。数据集的特征列包括`problem_id`、`prompt`、`reference_code`、`code_context`、`library_problem_id`、`library`、`test_case_cnt`、`perturbation_type`和`perturbation_origin_id`。数据集主要用于代码生成任务,涉及多个Python库如Matplotlib、Numpy、Pandas等。
该数据集是DS-1000的重新上传版本,元数据字典已被提取到列中,分类变量现在为`ClassLabel`类型,并且数据集原生为parquet格式。数据集的特征列包括`problem_id`、`prompt`、`reference_code`、`code_context`、`library_problem_id`、`library`、`test_case_cnt`、`perturbation_type`和`perturbation_origin_id`。数据集主要用于代码生成任务,涉及多个Python库如Matplotlib、Numpy、Pandas等。
提供机构:
claudios
原始信息汇总
数据集概述
数据集特征
- prompt:字符串类型
- reference_code:字符串类型
- code_context:字符串类型
- problem_id:整数类型(int64)
- library_problem_id:整数类型(int64)
- library:分类标签类型,包含以下类别:
- 0: Matplotlib
- 1: Numpy
- 2: Pandas
- 3: Pytorch
- 4: Scipy
- 5: Sklearn
- 6: Tensorflow
- test_case_cnt:整数类型(int64)
- perturbation_type:分类标签类型,包含以下类别:
- 0: Difficult-Rewrite
- 1: Origin
- 2: Semantic
- 3: Surface
- perturbation_origin_id:整数类型(int64)
数据集划分
- test:
- 数据大小:3136179字节
- 示例数量:1000
数据集大小
- 下载大小:712717字节
- 数据集总大小:3136179字节
许可证
- cc-by-sa-4.0
语言
- 代码
任务类别
- text2text-generation
标签
- code-generation



