ju-resplande/askD
收藏Hugging Face2022-10-29 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ju-resplande/askD
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是基于ELI5数据集,并适配了Reddit上的Medical Questions (AskDocs)子论坛的内容。数据集还包含了从其他来源获取的外部数据,并翻译成了葡萄牙语。数据集支持的任务包括文本生成和问答任务,语言为英语和巴西葡萄牙语。数据集的规模在10万到100万之间,且是多语言和翻译相关的。
提供机构:
ju-resplande
原始信息汇总
数据集概述
数据集基本信息
- 名称: AskDocs
- 语言: 英语 (BCP-47 en) 和 巴西葡萄牙语 (BCP-47 pt-BR)
- 许可证: LGPL-3.0
- 多语言性: 多语言,包含翻译
- 大小: 100K<n<1M
- 源数据集: 扩展自 ELI5
任务类别
- 任务类别: 文本到文本生成
- 具体任务: 抽象问答 (abstractive-qa), 封闭领域问答 (closed-domain-qa)
数据集结构
- 数据分割:
- 英语 (en):
- 训练集: 24256
- 验证集: 5198
- 测试集: 5198
- 外部数据: 166804
- 葡萄牙语 (pt):
- 训练集: 24256
- 验证集: 5198
- 测试集: 5198
- 外部数据: 166804
- 英语 (en):
数据集创建
- 源数据时间范围: 2013年1月至2019年12月
许可证信息
- 许可证: LGPL-3.0
引用信息
bibtex @misc{Gomes20202, author = {GOMES, J. R. S.}, title = {PLUE: Portuguese Language Understanding Evaluation}, year = {2020}, publisher = {GitHub}, journal = {GitHub repository}, howpublished = {url{https://github.com/ju-resplande/askD}}, commit = {42060c4402c460e174cbb75a868b429c554ba2b7} }
贡献者
- 贡献者: @ju-resplande



