dot-ammar/AR-dotless-small
收藏Hugging Face2023-09-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dot-ammar/AR-dotless-small
下载链接
链接失效反馈官方服务:
资源简介:
AR-dotless-small数据集是一个包含阿拉伯语翻译任务的小型数据集,大小介于10K到100K之间。数据集包含两个特征:clean和dotless,均为字符串类型。数据集主要分为训练集,训练集包含103403个示例,总字节数为18718829.46787407。下载大小为10451596字节,数据集大小为18718829.46787407。
AR-dotless-small数据集是一个包含阿拉伯语翻译任务的小型数据集,大小介于10K到100K之间。数据集包含两个特征:clean和dotless,均为字符串类型。数据集主要分为训练集,训练集包含103403个示例,总字节数为18718829.46787407。下载大小为10451596字节,数据集大小为18718829.46787407。
提供机构:
dot-ammar
原始信息汇总
数据集概述
基本信息
- 语言: 阿拉伯语
- 数据规模: 10K<n<100K
- 任务类型: 翻译
- 数据集名称: AR-dotless-small
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集信息
- 特征:
- 名称: clean
- 数据类型: string
- 名称: dotless
- 数据类型: string
- 名称: clean
- 分割:
- 名称: train
- 字节数: 18718829.46787407
- 样本数: 103403
- 名称: train
- 下载大小: 10451596
- 数据集大小: 18718829.46787407



