five

HuggingFaceH4/helpful-self-instruct-raw

收藏
Hugging Face2023-02-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HuggingFaceH4/helpful-self-instruct-raw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为helpful-self-instruct-raw,源自Self-Instruct项目的finetuning子集,经过轻度格式化处理,去除了尾随空格和<|endoftext|>标记。数据集包含instruction和demonstration两个特征,均为字符串类型。数据集分为train部分,包含82612个示例,总大小为20412870字节。下载大小为12532431字节,遵循apache-2.0许可证,标签为human-feedback。

数据集信息: 特征项: - 字段名称:instruction(指令),数据类型:字符串 - 字段名称:demonstration(示范),数据类型:字符串 数据划分: - 划分名称:train(训练集),字节数:20412870,样本数量:82612 下载大小:12532431 数据集总大小:20412870 许可证:Apache许可证2.0 标签: - human-feedback(人类反馈) # "helpful-self-instruct-raw"数据集卡片 本数据集源自[Self-Instruct](https://github.com/yizhongw/self-instruct)的`finetuning`(微调)子集,仅经过轻量格式处理以移除尾部空格与`<|endoftext|>` Token。
提供机构:
HuggingFaceH4
原始信息汇总

数据集概述

数据集名称

helpful-self-instruct-raw

数据集特征

  • instruction: 数据类型为字符串。
  • demonstration: 数据类型为字符串。

数据集分割

  • train: 包含82612个示例,总字节数为20412870。

数据集大小

  • 下载大小: 12532431字节
  • 数据集大小: 20412870字节

许可证

apache-2.0

标签

  • human-feedback
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作