mmhamdy/Arabic-OpenHermes-Filtered
收藏Hugging Face2024-03-07 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mmhamdy/Arabic-OpenHermes-Filtered
下载链接
链接失效反馈官方服务:
资源简介:
这是一个基于Arabic-OpenHermes-2.5的筛选版本,仅包含提示中不含任何拉丁字符的示例。数据集包含id、source、conversations、prompt和response等特征,均为字符串类型。数据集分为训练集,包含78061个示例。数据集支持阿拉伯语,适用于问答任务,标签为合成数据,大小类别为10K到100K之间。
This is a filtered version of Arabic-OpenHermes-2.5 and contains only examples whose prompts do not contain any Latin characters. The dataset includes features such as id, source, conversations, prompt, and response, all of which are string types. The dataset is divided into a training set with 78061 examples. The dataset supports Arabic and is suitable for question-answering tasks, tagged as synthetic data, with a size category between 10K and 100K.
提供机构:
mmhamdy
原始信息汇总
数据集概述
数据特征
- id: 字符串类型
- source: 字符串类型
- conversations: 字符串类型
- prompt: 字符串类型
- response: 字符串类型
数据划分
- train:
- 字节数: 290367089
- 样本数: 78061
数据大小
- 下载大小: 119981787
- 数据集大小: 290367089
配置
- default:
- 数据文件:
- 划分: train
- 路径: data/train-*
- 数据文件:
语言
- 阿拉伯语
任务类别
- 问答
标签
- 合成数据
数据规模
- 10K<n<100K
描述
- 该数据集是阿拉伯语-OpenHermes-2.5的过滤版本,仅包含提示中不含任何拉丁字符的示例。



