saied/Persian_Chat_Dataset
收藏Hugging Face2024-03-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/saied/Persian_Chat_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是ultrachat_200k的一个子集,用于训练最先进的7b聊天模型Zephyr-7B-β。该数据集已被翻译成波斯语。
该数据集是ultrachat_200k的一个子集,用于训练最先进的7b聊天模型Zephyr-7B-β。该数据集已被翻译成波斯语。
提供机构:
saied
原始信息汇总
数据集概述
基本信息
- 语言: 波斯语 (fa)
- 许可证: MIT
- 数据规模: 100K<n<1M
数据结构
- 特征:
- 名称: messages
- 列表:
- 名称: content 数据类型: string
- 名称: role 数据类型: string
数据分割
- 训练集:
- 名称: train
- 字节数: 94580784
- 样本数: 10000
文件信息
- 下载大小: 38856976
- 数据集大小: 94580784
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*



