TheSkullery/Aether-Lite-V1.6
收藏Hugging Face2024-06-11 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/TheSkullery/Aether-Lite-V1.6
下载链接
链接失效反馈官方服务:
资源简介:
Aether Lite数据集旨在平衡创意写作、Slop和智能。该数据集由SteelSkull创建,包含多种功能,如数据集使用百分比控制、数据集洗牌和基于哈希的第二阶段去重。数据集使用了多个子数据集,如jondurbin/airoboros-3.2和mrfakename/Capybara-ShareGPT等,并对每个子数据集的使用百分比和处理情况进行了详细记录。此外,数据集还进行了去重处理,以确保数据的质量。
Aether Lite数据集旨在平衡创意写作、Slop和智能。该数据集由SteelSkull创建,包含多种功能,如数据集使用百分比控制、数据集洗牌和基于哈希的第二阶段去重。数据集使用了多个子数据集,如jondurbin/airoboros-3.2和mrfakename/Capybara-ShareGPT等,并对每个子数据集的使用百分比和处理情况进行了详细记录。此外,数据集还进行了去重处理,以确保数据的质量。
提供机构:
TheSkullery
原始信息汇总
数据集信息
特征
- conversations
- from: 数据类型为字符串
- value: 数据类型为字符串
- system: 数据类型为字符串
- tools: 数据类型为字符串
- origin: 数据类型为字符串
- script_version: 数据类型为字符串
数据分割
- train
- 字节数: 448749579
- 样本数: 134090
下载与数据大小
- 下载大小: 254091092 字节
- 数据集大小: 448749579 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:
许可证
- license: apache-2.0
大小分类
- size_categories:
- 100K < n < 1M



