five

arbml/CIDAR-MCQ-100

收藏
Hugging Face2024-04-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/arbml/CIDAR-MCQ-100
下载链接
链接失效反馈
官方服务:
资源简介:
CIDAR-MCQ-100数据集包含100个关于阿拉伯文化的多项选择题和答案,用于评估语言模型在文化相关性方面的表现。数据集的结构包括问题、四个选项和正确答案。数据集的语言为阿拉伯语,许可证为Apache-2.0。

CIDAR-MCQ-100数据集包含100个关于阿拉伯文化的多项选择题和答案,用于评估语言模型在文化相关性方面的表现。数据集的结构包括问题、四个选项和正确答案。数据集的语言为阿拉伯语,许可证为Apache-2.0。
提供机构:
arbml
原始信息汇总

数据集卡片 for "CIDAR-MCQ-100"

数据集概述

CIDAR-MCQ-100 包含 100 道关于阿拉伯文化的多项选择题及答案。

数据集结构

  • Question(str): 关于阿拉伯文化的问题。
  • A(str): 第一个选项。
  • B(str): 第二个选项。
  • C(str): 第三个选项。
  • D(str): 第四个选项。
  • answer(str): 从 A, B, C, D 中正确的选项。

数据集加载

您可以直接从 HuggingFace 下载数据集,或使用以下代码:

python from datasets import load_dataset cidar = load_dataset(arbml/CIDAR-MCQ-100)

数据集示例

Question: حدد حيوان مشهور في المنطقة

A: الجمل B: اللاما C: الكانغرو D: الدب القطبي answer: A

许可证

该数据集在 Apache-2.0 许可证下发布。

引用

@misc{alyafeai2024cidar, title={{CIDAR: Culturally Relevant Instruction Dataset For Arabic}}, author={Zaid Alyafeai and Khalid Almubarak and Ahmed Ashraf and Deema Alnuhait and Saied Alshahrani and Gubran A. Q. Abdulrahman and Gamil Ahmed and Qais Gawah and Zead Saleh and Mustafa Ghaleb and Yousef Ali and Maged S. Al-Shaibani}, year={2024}, eprint={2402.03177}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作