HachiML/amenokaku-code-instruct-python-mit-450
收藏Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/HachiML/amenokaku-code-instruct-python-mit-450
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本生成任务的小型数据集,包含442个训练样本。数据集特征包括输入、输出、任务、索引、许可证、来源和指令。数据集主要与Python编程相关,是从特定来源(如gasyori_100_knocks、datascience_100_knocks_python、bifi等)筛选出来的,并且是从bifi来源中随机筛选出的100个样本。数据集采用MIT许可证,适用于代码和Python相关的任务。
该数据集是一个用于文本生成任务的小型数据集,包含442个训练样本。数据集特征包括输入、输出、任务、索引、许可证、来源和指令。数据集主要与Python编程相关,是从特定来源(如gasyori_100_knocks、datascience_100_knocks_python、bifi等)筛选出来的,并且是从bifi来源中随机筛选出的100个样本。数据集采用MIT许可证,适用于代码和Python相关的任务。
提供机构:
HachiML
原始信息汇总
数据集概述
基本信息
- 语言: 日语 (
ja) - 许可证: MIT
- 大小分类: 小于1K (
n<1K) - 任务分类: 文本生成 (
text-generation)
数据集特征
- 输入 (
input): 字符串类型 (string) - 输出 (
output): 字符串类型 (string) - 任务 (
task): 字符串类型 (string) - 索引 (
index): 整数类型 (int64) - 许可证 (
liscence): 字符串类型 (string) - 来源 (
source): 字符串类型 (string) - 指令 (
instruction): 字符串类型 (string)
数据集划分
- 训练集 (
train):- 数据量: 274655.39620535716 字节
- 样本数: 442
数据集大小
- 下载大小: 208854 字节
- 数据集大小: 274655.39620535716 字节
配置
- 默认配置 (
default):- 数据文件路径:
data/train-*
- 数据文件路径:
标签
- 代码 (
code) - Python (
python)



