Trust-Data|自然语言处理数据集|信息检索数据集
收藏数据集概述
基本信息
- 语言: 英语
- 许可证: Apache 2.0
- 标签: 引文生成
- 注释创建者: 机器生成
- 数据集名称: TRUST
- 数据集规模: 10K<n<100K
- 源数据集: ASQA, QAMPARI, ELI5, EXPERTQA
- 任务类别: 文本生成, 文本到文本生成
- 任务ID: 对话, 开放式问答
数据集配置
-
配置名称: trust_score
- 数据文件:
asqa_eval:Trust-Score/asqa_eval_top100_calibrated.jsonqampari_eval:Trust-Score/qampari_eval_top100_calibrated.jsoneli5_eval:Trust-Score/eli5_eval_top100_calibrated.jsonexpertqa_eval:Trust-Score/expertqa_eval_top100_calibrated.json
- 默认配置: 是
- 数据文件:
-
配置名称: trust_align
- 数据文件:
train:Trust-Align/train.jsontest:Trust-Align/test.json
- 数据文件:
数据集描述
Trust-score
- 数据集内容: 包含ASQA、QAMPARI、ELI5和EXPERTQA的顶级100个GTR检索结果,以及ELI5的顶级100个BM25检索结果。每个问题的可回答性基于其附带的文档进行评估。
- 数据结构:
question: 问题answers: 所有黄金答案列表docs: 相关文档证据列表title: 文档标题text: 文档片段answers_found: 答案是否在文档中找到的标志rec_score: 召回分数
Trust-align
- 数据集内容: 包含19K高质量对齐对,用于增强模型的可信度。
- 数据结构:
prompt: 模型输入,包含指令、问题和相应文档chosen: 配对数据集中的正面响应rejected: 配对数据集中的负面响应messages:prompt和chosen的chatML对话格式
引用信息
@misc{song2024measuringenhancingtrustworthinessllms, title={Measuring and Enhancing Trustworthiness of LLMs in RAG through Grounded Attributions and Learning to Refuse}, author={Maojia Song and Shang Hong Sim and Rishabh Bhardwaj and Hai Leong Chieu and Navonil Majumder and Soujanya Poria}, year={2024}, eprint={2409.11242}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2409.11242}, }

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
Crop Yield Prediction Dataset
Impact of Environmental Factors on Crop Yields Across Countries
kaggle 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
ScanNet v2
ScanNet 是一个 RGB-D 视频数据集,包含 1500 多次扫描中的 250 万个视图,并使用 3D 相机姿势、表面重建和实例级语义分割进行注释。为了收集这些数据,我们设计了一个易于使用且可扩展的 RGB-D 捕获系统,其中包括自动表面重建和众包语义注释。我们表明,使用这些数据有助于在几个 3D 场景理解任务上实现最先进的性能,包括 3D 对象分类、语义体素标记和 CAD 模型检索。
OpenDataLab 收录
