BSC-LT/InstrucatQA
收藏Hugging Face2023-12-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BSC-LT/InstrucatQA
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于微调RAG应用模型的指令数据集,包含了来自InstruCAT (ca)、SQUAC (es)、SQUAD (en)的问答指令,以及CA和ES MENTOR数据集,用于提供生成响应的认知背景。数据集分为训练集和验证集,分别包含66139和11674条指令。
该数据集是用于微调RAG应用模型的指令数据集,包含了来自InstruCAT (ca)、SQUAC (es)、SQUAD (en)的问答指令,以及CA和ES MENTOR数据集,用于提供生成响应的认知背景。数据集分为训练集和验证集,分别包含66139和11674条指令。
提供机构:
BSC-LT
原始信息汇总
数据集卡片
数据集详情
数据集描述
该数据集是从InstruCAT(ca)、SQUAC(es)、SQUAD(en)以及CA和ES MENTOR通用数据集中合并的QA指令,旨在为生成响应提供认知背景。包含66139条训练指令和11674条验证指令。
- 语言(NLP): ca, es, en
- 许可证: apache-2.0
数据集用途
用于加泰罗尼亚语RAG应用的实验。
数据集结构
[更多信息待补充]
数据集创建
数据收集和处理
[更多信息待补充]
数据来源生产者
[更多信息待补充]
偏差、风险和限制
用户应了解数据集的风险、偏差和限制。更多信息待补充。



