five

Mubtakir/bayaan-alignment-sample

收藏
Hugging Face2025-11-10 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/Mubtakir/bayaan-alignment-sample
下载链接
链接失效反馈
官方服务:
资源简介:
Bayaan对齐数据集是一个阿拉伯语-英语双语对齐的数据集,用于Bayaan混合编程语言。数据集包含9个领域(社会、物理、混合、交通、健康、教育、工作、市场、公共),共1000个示例(训练=800,验证=100,测试=100),语言平衡为50%阿拉伯语和50%英语。数据集使用JSONL模式存储自然文本、Bayaan代码、逻辑解释以及实体/动作/状态信息。

Bilingual Arabic-English alignment dataset for the Bayaan hybrid programming language, containing 9 domains (social, physical, mixed, transport, health, education, work, market, public), 1000 examples (train=800, val=100, test=100), balanced languages: 50% Arabic, 50% English. The dataset uses a JSONL schema to store natural text, Bayan code, logic explanation, and entities/actions/states information.
提供机构:
Mubtakir
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作