five

claudios/ds1000

收藏
Hugging Face2024-05-01 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/claudios/ds1000
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是DS-1000的重新上传版本,元数据字典已被提取到列中,分类变量现在为`ClassLabel`类型,并且数据集原生为parquet格式。数据集的特征列包括`problem_id`、`prompt`、`reference_code`、`code_context`、`library_problem_id`、`library`、`test_case_cnt`、`perturbation_type`和`perturbation_origin_id`。数据集主要用于代码生成任务,涉及多个Python库如Matplotlib、Numpy、Pandas等。

该数据集是DS-1000的重新上传版本,元数据字典已被提取到列中,分类变量现在为`ClassLabel`类型,并且数据集原生为parquet格式。数据集的特征列包括`problem_id`、`prompt`、`reference_code`、`code_context`、`library_problem_id`、`library`、`test_case_cnt`、`perturbation_type`和`perturbation_origin_id`。数据集主要用于代码生成任务,涉及多个Python库如Matplotlib、Numpy、Pandas等。
提供机构:
claudios
原始信息汇总

数据集概述

数据集特征

  • prompt:字符串类型
  • reference_code:字符串类型
  • code_context:字符串类型
  • problem_id:整数类型(int64)
  • library_problem_id:整数类型(int64)
  • library:分类标签类型,包含以下类别:
    • 0: Matplotlib
    • 1: Numpy
    • 2: Pandas
    • 3: Pytorch
    • 4: Scipy
    • 5: Sklearn
    • 6: Tensorflow
  • test_case_cnt:整数类型(int64)
  • perturbation_type:分类标签类型,包含以下类别:
    • 0: Difficult-Rewrite
    • 1: Origin
    • 2: Semantic
    • 3: Surface
  • perturbation_origin_id:整数类型(int64)

数据集划分

  • test
    • 数据大小:3136179字节
    • 示例数量:1000

数据集大小

  • 下载大小:712717字节
  • 数据集总大小:3136179字节

许可证

  • cc-by-sa-4.0

语言

  • 代码

任务类别

  • text2text-generation

标签

  • code-generation
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作