sanjay920/1million-gpt-4-llama
收藏Hugging Face2024-02-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sanjay920/1million-gpt-4-llama
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个包含994896个例子的训练集,总大小为3630771342字节。数据集的特征包括id、conversations和text,其中conversations是一个列表,包含from、value和weight三个字段。数据集被转换为sharegpt和llama chat格式。
该数据集是一个包含994896个例子的训练集,总大小为3630771342字节。数据集的特征包括id、conversations和text,其中conversations是一个列表,包含from、value和weight三个字段。数据集被转换为sharegpt和llama chat格式。
提供机构:
sanjay920
原始信息汇总
数据集概述
数据集信息
- 语言: 英语
- 特征:
- id: 数据类型为字符串
- conversations: 列表类型,包含以下子特征:
- from: 数据类型为字符串
- value: 数据类型为字符串
- weight: 数据类型为空
- text: 数据类型为字符串
数据分割
- 训练集:
- 字节数: 3630771342
- 样本数: 994896
数据集大小
- 下载大小: 1980759415
- 数据集大小: 3630771342
配置
- 配置名称: default
- 数据文件:
- 分割: 训练集
- 路径: data/train-*



