BEE-spoke-data/TACO-hf
收藏Hugging Face2024-01-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BEE-spoke-data/TACO-hf
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个编程问题数据集,包含多个特征,如问题、解决方案、起始代码、输入输出、难度等。数据集分为训练集和测试集,分别包含25443和1000个样本。数据集的来源是BAAI/TACO,并且以HuggingFace数据集格式重新托管以便于使用。
该数据集是一个编程问题数据集,包含多个特征,如问题、解决方案、起始代码、输入输出、难度等。数据集分为训练集和测试集,分别包含25443和1000个样本。数据集的来源是BAAI/TACO,并且以HuggingFace数据集格式重新托管以便于使用。
提供机构:
BEE-spoke-data
原始信息汇总
数据集概述
数据集信息
特征
- question: 字符串类型
- solutions: 字符串类型
- starter_code: 字符串类型
- input_output: 字符串类型
- difficulty: 字符串类型
- raw_tags: 字符串类型
- name: 字符串类型
- source: 字符串类型
- tags: 字符串类型
- skill_types: 字符串类型
- url: 字符串类型
- Expected Auxiliary Space: 字符串类型
- time_limit: 字符串类型
- date: 字符串类型
- picture_num: 字符串类型
- memory_limit: 字符串类型
- Expected Time Complexity: 字符串类型
数据分割
- train:
- 字节数: 4239311973
- 样本数: 25443
- test:
- 字节数: 481480755
- 样本数: 1000
数据集大小
- 下载大小: 2419845110 字节
- 数据集大小: 4720792728 字节
配置
- default:
- 数据文件:
- train: data/train-*
- test: data/test-*
- 数据文件:
源数据集
- BAAI/TACO
许可证
- apache-2.0
任务类别
- 文本生成
- 特征提取
语言
- 英语
标签
- BAAI/TACO
大小类别
- 10K<n<100K



