habanoz/airoboros-3.1-no-mathjson-max-1k
收藏Hugging Face2023-11-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/habanoz/airoboros-3.1-no-mathjson-max-1k
下载链接
链接失效反馈官方服务:
资源简介:
这是一个修改版的jondurbin/airoboros-3.1数据集,排除了mathjson实例,并限制了输入+输出+特殊标记的长度为1024个标记。数据集包含id、conversations(包含from和value两个子特征)和category等特征,训练集的大小为40852711.20890598字节,包含20180个示例。
提供机构:
habanoz
原始信息汇总
数据集卡片 "airoboros-3.1-no-mathjson-max-1k"
数据集概述
- 数据集名称: airoboros-3.1-no-mathjson-max-1k
- 版本: 3.1
- 修改说明:
- 排除了mathjson实例
- 输入+输出+特殊标记的长度限制为1024个标记(假设为llama聊天格式)
数据集配置
- 默认配置:
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:
数据集信息
- 特征:
- id: 字符串类型
- conversations: 列表类型
- from: 字符串类型
- value: 字符串类型
- category: 字符串类型
- 分割:
- train:
- 字节数: 40852711.20890598
- 样本数: 20180
- train:
- 下载大小: 6394016
- 数据集大小: 40852711.20890598



