five

wisenut-nlp-team/aihub_retriever_commonsense

收藏
Hugging Face2024-07-22 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/wisenut-nlp-team/aihub_retriever_commonsense
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了标题(title)、上下文(context)和问题(questions)等信息的文本数据,适用于文本理解和问题回答等NLP任务。数据集分为训练集和验证集,可用于模型训练和评估。

The dataset includes text data with information such as title, context, and questions, which is suitable for NLP tasks such as text understanding and question answering. The dataset is divided into training and validation sets for model training and evaluation.
提供机构:
wisenut-nlp-team
原始信息汇总

数据集概述

基本信息

  • 名称: aihub_retriever_commonsense
  • 别名: wisenut-nlp-team/aihub_retriever_commonsense
  • 描述: 일반상식 (一般常识)
  • 创建者: wisenut-nlp
  • 关键词:
    • 10K - 100K
    • parquet
    • Text
    • Datasets
    • pandas
    • Croissant
    • 🇺🇸 Region: US
  • URL: https://hf-mirror.com/datasets/wisenut-nlp-team/aihub_retriever_commonsense

数据格式

  • 分布:
    • 类型: cr:FileObject

    • 名称: repo

    • 描述: The HF Mirror git repository.

    • 内容URL: https://hf-mirror.com/datasets/wisenut-nlp-team/aihub_retriever_commonsense/tree/refs%2Fconvert%2Fparquet

    • 编码格式: git+https

    • SHA256: https://github.com/mlcommons/croissant/issues/80

    • 类型: cr:FileSet

    • 名称: parquet-files-for-config-default

    • 描述: The underlying Parquet files as converted by HF Mirror (see: https://hf-mirror.com/docs/datasets-server/parquet).

    • 包含于: repo

    • 编码格式: application/x-parquet

    • 包含: default//.parquet

数据集详情

  • 记录集:
    • 类型: cr:RecordSet
    • 名称: default
    • 描述: wisenut-nlp-team/aihub_retriever_commonsense - default subset
      • 2 splits: train, validation
      • 1 skipped column: questions
    • 字段:
      • 类型: cr:Field

      • 名称: default/id

      • 描述: Column id from the HF Mirror parquet file.

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取: column: id
      • 类型: cr:Field

      • 名称: default/title

      • 描述: Column title from the HF Mirror parquet file.

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取: column: title
      • 类型: cr:Field

      • 名称: default/context

      • 描述: Column context from the HF Mirror parquet file.

      • 数据类型: sc:Text

      • 来源:

        • 文件集: parquet-files-for-config-default
        • 提取: column: context

符合标准

  • 标准: http://mlcommons.org/croissant/1.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作