five

Jianshu001/arabic-daily-batch02-cascade-5k

收藏
Hugging Face2026-04-23 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Jianshu001/arabic-daily-batch02-cascade-5k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含5001条阿拉伯语文本记录,通过Gemma-4-31B进行级联重写,并使用GPT-5.4-mini作为二元评判进行过滤(仅删除,不重写)。数据处理流程与batch01相同。

This dataset contains 5001 Arabic text records, processed via cascade rewrite using Gemma-4-31B and filtered by a GPT-5.4-mini binary judge (drop-only, no rewrites). The pipeline is the same as batch01.
提供机构:
Jianshu001
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作