h2oai/h2ogpt-oig-instruct-cleaned
收藏Hugging Face2023-04-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/h2oai/h2ogpt-oig-instruct-cleaned
下载链接
链接失效反馈官方服务:
资源简介:
h2oGPT数据集是一个开源的指令型数据集,用于大型语言模型的微调。该数据集包含195436行数据,每行数据只有一个字段input。数据集来源于LAION OIG,并经过去毒和过滤处理。数据集的许可证是Apache-2.0,允许商业使用。
h2oGPT数据集是一个开源的指令型数据集,用于大型语言模型的微调。该数据集包含195436行数据,每行数据只有一个字段input。数据集来源于LAION OIG,并经过去毒和过滤处理。数据集的许可证是Apache-2.0,允许商业使用。
提供机构:
h2oai
原始信息汇总
h2oGPT Data Card 概述
数据集基本信息
- 名称:
h2ogpt-oig-instruct-cleaned - 类型: 开源指令型数据集
- 用途: 用于大型语言模型的微调
- 许可: Apache-2.0,允许商业使用
数据集详细规格
- 行数: 195,436
- 列数: 1
- 列名:
[input]
数据来源
- 原始数据集: LAION OIG Dataset
- 处理过程: 通过h2oGPT仓库中的脚本进行数据净化和筛选



