fedryanto/UnibQuAD
收藏Hugging Face2023-07-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fedryanto/UnibQuAD
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为NLP任务自行收集的。
该数据集是为NLP任务自行收集的。
提供机构:
fedryanto
原始信息汇总
数据集概述
数据集名称
- SQuAD-UNIB
数据集摘要
- 该数据集是为NLP任务独立收集的。
支持的任务和排行榜
- 提取式问答(Extractive Question Answering)
语言
- 印度尼西亚语(id)
许可证
- CC-BY-4.0
多语言性
- 单语种
大小类别
- 1K<n<10K
源数据集
- 扩展自维基百科
训练和评估索引
- 配置:plain_text
- 任务:问答
- 任务ID:extractive_question_answering
- 分割:
- 训练分割:train
- 评估分割:validation
- 列映射:
- 问题:question
- 上下文:context
- 答案:
- 文本:text
- 答案开始位置:answer_start
- 度量标准:
- 类型:squad
- 名称:SQuAD
数据集结构
-
数据实例
- 示例: json { "answers": { "answer_start": [1], "text": ["This is a test text"] }, "context": "This is a test context.", "id": "1", "question": "Is this a test?", "title": "train test" }
-
数据字段
- plain_text配置下的字段:
- id:字符串类型
- title:字符串类型
- context:字符串类型
- question:字符串类型
- answers:字典类型,包含:
- text:字符串类型
- answer_start:整数类型(int32)
- plain_text配置下的字段:
数据集创建
- 注释创建者:众包
- 语言创建者:众包和现有资源
使用数据集的考虑
- 社会影响、偏见讨论、其他已知限制、数据集策展人、许可信息、引用信息、贡献者信息等均未提供详细信息。



