five

Kamyar-zeinalipour/ArabicSense

收藏
Hugging Face2024-12-14 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/Kamyar-zeinalipour/ArabicSense
下载链接
链接失效反馈
官方服务:
资源简介:
ArabicSense Benchmark数据集旨在评估阿拉伯语大型语言模型(LLMs)的世界知识常识推理能力。该数据集包含三个主要任务:Task 1(意义验证)、Task 2(原因识别)和Task 3(解释生成)。Task 1的数据集包含成对的语句,标记为有意义或无意义,格式为JSONL文件,每个条目包含唯一标识符、语句内容和二进制标签。Task 2和Task 3的数据集分别存储在其他仓库中。该数据集特别针对阿拉伯语设计,填补了非英语语言常识推理评估的空白,并通过多样化的任务全面评估LLM的能力。

The Task 1: Sense Validation dataset of the ArabicSense Benchmark is designed to evaluate the ability of a system to distinguish between sensible and nonsensical statements. The dataset includes pairs of statements labeled as sensible or nonsensical. Each entry contains a unique identifier, a natural language statement, and a binary label (1 for sensible, 0 for nonsensical). The dataset is in JSONL format.
提供机构:
Kamyar-zeinalipour
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作