LongCite-45k 大模型细粒度提升数据集
收藏超神经2024-09-28 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/34665
下载链接
链接失效反馈官方服务:
资源简介:
LongCite-45k 是由清华大学于 2024 年推出的开源数据集,旨在提升大型语言模型 (LLMs) 在长文本问答任务中的可信度和可验证性。相关论文成果为「LongCite: Enabling LLMs to Generate Fine-grained Citations in Long-context QA」。
LongCite-45k is an open-source dataset released by Tsinghua University in 2024, which aims to enhance the credibility and verifiability of Large Language Models (LLMs) in long-context question answering tasks. The corresponding research paper is titled "LongCite: Enabling LLMs to Generate Fine-grained Citations in Long-context QA".
创建时间:
2024-09-23
搜集汇总
数据集介绍

背景与挑战
背景概述
LongCite-45k是清华大学于2024年发布的开源数据集,旨在提升大型语言模型在长文本问答任务中的可信度与可验证性。该数据集包含44,600条带有句子级引用的高质量问答数据,支持最长128k token的上下文处理,通过生成细粒度引用帮助用户验证模型回答的准确性。
以上内容由遇见数据集搜集并总结生成



