five

ebayes/uhura-instruct-llama

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/ebayes/uhura-instruct-llama
下载链接
链接失效反馈
官方服务:
资源简介:
Uhura-TruthfulQA是一个多语言数据集,支持阿姆哈拉语、英语、豪萨语、斯瓦希里语、约鲁巴语和祖鲁语。数据集规模在10万到100万条数据之间,主要用于多项选择问答任务。

Uhura-TruthfulQA is a multilingual dataset supporting Amharic, English, Hausa, Swahili, Yoruba, and Zulu. The dataset size ranges between 100,000 and 1,000,000 entries and is primarily used for multiple-choice question answering tasks.
提供机构:
ebayes
原始信息汇总

数据集概述

基本信息

  • 名称: uhura-instruct-llama
  • 别名: ebayes/uhura-instruct-llama, Uhura-TruthfulQA
  • 描述: Uhura Instruct: Lazy Llama 2 Formatting
  • 创建者: Edward Bayes
  • 网址: uhura-instruct-llama
  • 许可证: CC BY-NC 4.0

数据格式

  • 分布:
    • 类型: cr:FileObject

    • 名称: repo

    • 描述: The HF Mirror git repository.

    • 内容URL: repo

    • 编码格式: git+https

    • SHA256: SHA256

    • 类型: cr:FileSet

    • 名称: parquet-files-for-config-default

    • 描述: The underlying Parquet files as converted by HF Mirror (see: Parquet).

    • 包含于: repo

    • 编码格式: application/x-parquet

    • 包含: default//.parquet

数据记录集

  • 类型: cr:RecordSet
  • 名称: default
  • 描述: ebayes/uhura-instruct-llama - default subset
  • 字段:
    • 类型: cr:Field
    • 名称: default/text
    • 描述: Column text from the HF Mirror parquet file.
    • 数据类型: sc:Text
    • 来源:
      • 文件集: parquet-files-for-config-default
      • 提取:
        • : text

关键词

  • multiple-choice
  • multiple-choice-qa
  • multilingual
  • Amharic
  • English
  • Hausa
  • Swahili
  • Yoruba
  • Zulu
  • cc-by-nc-4.0
  • 100K - 1M
  • json
  • Text
  • Datasets
  • pandas
  • Croissant
  • 🇺🇸 Region: US
  • uhura

符合标准

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作