five

FreedomIntelligence/ACVA-Arabic-Cultural-Value-Alignment

收藏
Hugging Face2023-09-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/FreedomIntelligence/ACVA-Arabic-Cultural-Value-Alignment
下载链接
链接失效反馈
官方服务:
资源简介:
ArabicCulture数据集由gpt3.5生成,包含8000多个真假问题,涵盖58个不同领域。其中,59.62%的答案为“真”,40.38%为“假”。数据集分为两个子集:data-all和data-select。data-all包含8000+数据,每个领域选取5个数据作为few-shot数据。data-select则是通过两位阿拉伯人对4000条数据进行筛选,最终保留2400条数据,覆盖9个领域,并分为测试集和验证集。
提供机构:
FreedomIntelligence
原始信息汇总

阿拉伯文化数据集概述

数据集基本信息

  • 语言: 阿拉伯语
  • 许可证: Apache 2.0
  • 数据规模: 1K<n<10K

数据集内容

  • 生成方式: 由gpt3.5生成
  • 数据量: 超过8000条真假问题
  • 问题领域: 涵盖58个不同领域
  • 答案分布:
    • “真”占59.62%
    • “假”占40.38%

数据处理

  • 数据选择:
    • 从每个领域选取5条数据作为少量样本数据
    • 由两名阿拉伯人评估4000条数据,最终保留两人均认为良好的数据,共2400条,覆盖9个领域
  • 数据划分: 将筛选后的数据分为测试集和验证集
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作