five

AswiN037/tamil-question-answering-dataset

收藏
Hugging Face2022-07-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AswiN037/tamil-question-answering-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含5个列:context, question, answer_start, answer_text, source。其中,context是泰米尔语中的一段小段落,question是根据context提出的问题,answer_text是从context中提取的文本片段,answer_start是answer_text的起始索引,source表示谁创建了这个context、question和answer对。source的来源包括团队KBA(由Karthi, Balaji, Azeez手动创建)、CHAII(一个Kaggle竞赛)和XQA(一个多语言问答数据集)。
提供机构:
AswiN037
原始信息汇总

数据集概述

数据集内容

  • 列数:5列
  • 列名及描述
    • context:泰米尔语的小段落
    • question:基于上下文提出的问题
    • answer_text:从上下文中提取的文本片段
    • answer_startanswer_text在上下文中的起始索引
    • source:创建上下文、问题、答案对的来源

数据来源

  • team KBA:由Karthi, Balaji, Azeez手动创建
  • CHAII:一个Kaggle竞赛
  • XQA:多语言问答数据集
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作