Kamyar-zeinalipour/ArabicSense
收藏Hugging Face2024-12-14 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/Kamyar-zeinalipour/ArabicSense
下载链接
链接失效反馈官方服务:
资源简介:
ArabicSense Benchmark数据集旨在评估阿拉伯语大型语言模型(LLMs)的世界知识常识推理能力。该数据集包含三个主要任务:Task 1(意义验证)、Task 2(原因识别)和Task 3(解释生成)。Task 1的数据集包含成对的语句,标记为有意义或无意义,格式为JSONL文件,每个条目包含唯一标识符、语句内容和二进制标签。Task 2和Task 3的数据集分别存储在其他仓库中。该数据集特别针对阿拉伯语设计,填补了非英语语言常识推理评估的空白,并通过多样化的任务全面评估LLM的能力。
The Task 1: Sense Validation dataset of the ArabicSense Benchmark is designed to evaluate the ability of a system to distinguish between sensible and nonsensical statements. The dataset includes pairs of statements labeled as sensible or nonsensical. Each entry contains a unique identifier, a natural language statement, and a binary label (1 for sensible, 0 for nonsensical). The dataset is in JSONL format.
提供机构:
Kamyar-zeinalipour



