HuggingFaceH4/helpful-self-instruct-raw
收藏Hugging Face2023-02-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HuggingFaceH4/helpful-self-instruct-raw
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为helpful-self-instruct-raw,源自Self-Instruct项目的finetuning子集,经过轻度格式化处理,去除了尾随空格和<|endoftext|>标记。数据集包含instruction和demonstration两个特征,均为字符串类型。数据集分为train部分,包含82612个示例,总大小为20412870字节。下载大小为12532431字节,遵循apache-2.0许可证,标签为human-feedback。
数据集信息:
特征项:
- 字段名称:instruction(指令),数据类型:字符串
- 字段名称:demonstration(示范),数据类型:字符串
数据划分:
- 划分名称:train(训练集),字节数:20412870,样本数量:82612
下载大小:12532431
数据集总大小:20412870
许可证:Apache许可证2.0
标签:
- human-feedback(人类反馈)
# "helpful-self-instruct-raw"数据集卡片
本数据集源自[Self-Instruct](https://github.com/yizhongw/self-instruct)的`finetuning`(微调)子集,仅经过轻量格式处理以移除尾部空格与`<|endoftext|>` Token。
提供机构:
HuggingFaceH4
原始信息汇总
数据集概述
数据集名称
helpful-self-instruct-raw
数据集特征
- instruction: 数据类型为字符串。
- demonstration: 数据类型为字符串。
数据集分割
- train: 包含82612个示例,总字节数为20412870。
数据集大小
- 下载大小: 12532431字节
- 数据集大小: 20412870字节
许可证
apache-2.0
标签
- human-feedback



