Arabic-Clip/Arabic_dataset_13M_translated_cleaned_v2_jsonl_format_ViT-B-16-plus-240
收藏Hugging Face2023-10-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Arabic-Clip/Arabic_dataset_13M_translated_cleaned_v2_jsonl_format_ViT-B-16-plus-240
下载链接
链接失效反馈官方服务:
资源简介:
This dataset repo contains the dataset (CC3M+CC12M+SBU) translated using opus-mt-en-ar and cleaned. Its size about 13M
提供机构:
Arabic-Clip
原始信息汇总
数据集概述
数据集内容
- 数据集包含:CC3M、CC12M 和 SBU 数据集的翻译版本。
- 翻译工具:使用 opus-mt-en-ar 进行翻译。
- 数据处理:翻译后进行了清洗处理。
数据集规模
- 数据集大小:约 13M。



