Mubtakir/bayaan-alignment-sample
收藏Hugging Face2025-11-10 更新2025-11-15 收录
下载链接:
https://hf-mirror.com/datasets/Mubtakir/bayaan-alignment-sample
下载链接
链接失效反馈官方服务:
资源简介:
Bayaan对齐数据集是一个阿拉伯语-英语双语对齐的数据集,用于Bayaan混合编程语言。数据集包含9个领域(社会、物理、混合、交通、健康、教育、工作、市场、公共),共1000个示例(训练=800,验证=100,测试=100),语言平衡为50%阿拉伯语和50%英语。数据集使用JSONL模式存储自然文本、Bayaan代码、逻辑解释以及实体/动作/状态信息。
Bilingual Arabic-English alignment dataset for the Bayaan hybrid programming language, containing 9 domains (social, physical, mixed, transport, health, education, work, market, public), 1000 examples (train=800, val=100, test=100), balanced languages: 50% Arabic, 50% English. The dataset uses a JSONL schema to store natural text, Bayan code, logic explanation, and entities/actions/states information.
提供机构:
Mubtakir



