five

masa-ok/JAQKET_1000

收藏
Hugging Face2024-04-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/masa-ok/JAQKET_1000
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-sa-4.0 dataset_info: features: - name: question dtype: string - name: answer_entity dtype: string - name: label dtype: int64 - name: answer_candidates dtype: string splits: - name: train num_bytes: 272455 num_examples: 1000 - name: validation num_bytes: 56309 num_examples: 200 download_size: 212204 dataset_size: 328764 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* --- ランダムに抽出した1000件の学習データセットへ変換 ``` 元データ # DatasetDict({ # train: Dataset({ # features: ['qid', 'question', 'answer_entity', 'label', 'answer_candidates', 'contexts'], # num_rows: 13061 # }) # validation: Dataset({ # features: ['qid', 'question', 'answer_entity', 'label', 'answer_candidates', 'contexts'], # num_rows: 271 # }) # }) 変換データ # DatasetDict({ # train: Dataset({ # features: ['question', 'answer_entity', 'label', 'answer_candidates'], # num_rows: 1000 # }) # validation: Dataset({ # features: ['question', 'answer_entity', 'label', 'answer_candidates'], # num_rows: 200 # }) # }) ``` ``` データ元のクレジット lisence : cc-by-sa-4.0 name : kumapo URL : https://huggingface.co/datasets/kumapo/JAQKET @InProceedings{Kurihara_nlp2020, author = "鈴木正敏 and 鈴木潤 and 松田耕史 and ⻄田京介 and 井之上直也", title = "JAQKET: クイズを題材にした日本語 QA データセットの構築", booktitle = "言語処理学会第26回年次大会", year = "2020", url = "https://www.anlp.jp/proceedings/annual_meeting/2020/pdf_dir/P2-24.pdf" note= "in Japanese"}' ```
提供机构:
masa-ok
原始信息汇总

数据集概述

数据集信息

  • 许可证: cc-by-sa-4.0
  • 数据集大小:
    • 下载大小: 212204字节
    • 数据集大小: 328764字节

数据集特征

  • question: 字符串类型
  • answer_entity: 字符串类型
  • label: 整数类型 (int64)
  • answer_candidates: 字符串类型

数据集划分

  • 训练集:
    • 大小: 272455字节
    • 示例数量: 1000
  • 验证集:
    • 大小: 56309字节
    • 示例数量: 200

数据文件配置

  • 配置名称: default
  • 数据文件路径:
    • 训练集: data/train-*
    • 验证集: data/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作