systemk/origami-data
收藏Hugging Face2024-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/systemk/origami-data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置版本,每个版本主要包含文本数据,数据类型为字符串。每个配置版本都有训练集分割,详细记录了训练集的例子数量和数据大小。
该数据集包含多个配置版本,每个版本主要包含文本数据,数据类型为字符串。每个配置版本都有训练集分割,详细记录了训练集的例子数量和数据大小。
提供机构:
systemk
原始信息汇总
数据集详情
数据集配置 v0.2
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 1665085111.8754308
- 样本数: 359366
- 下载大小: 3133404413
- 数据集大小: 1665085111.8754308
数据集配置 v0.2-full
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 1433415294.4921181
- 样本数: 309366
- 下载大小: 2700841746
- 数据集大小: 1433415294.4921181
数据集配置 v0.2-lora
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 231669817.38331267
- 样本数: 50000
- 下载大小: 432797937
- 数据集大小: 231669817.38331267
数据集配置 v0.2:lora
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 231669817.38331267
- 样本数: 50000
- 下载大小: 432797937
- 数据集大小: 231669817.38331267
数据集配置 v0.3
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 2487928047.6435037
- 样本数: 518732
- 下载大小: 4575030520
- 数据集大小: 2487928047.6435037
数据集配置 v0.3-full
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 2008310818.0059445
- 样本数: 418732
- 下载大小: 3707433739
- 数据集大小: 2008310818.0059445
数据集配置 v0.3-lora
- 特征:
- 名称: text
- 数据类型: string
- 分割:
- 名称: train
- 字节数: 479617229.63755924
- 样本数: 100000
- 下载大小: 867658472
- 数据集大小: 479617229.63755924



