T2Ranking
收藏arXiv2023-04-07 更新2024-06-21 收录
下载链接:
https://github.com/THUIR/T2Ranking/
下载链接
链接失效反馈官方服务:
资源简介:
T2Ranking是由清华大学和腾讯公司合作开发的大型中文段落排序数据集,旨在解决中文信息检索领域中数据集规模小、相关性标注粗糙和假阴性问题。该数据集包含超过30万查询和200多万个独特段落,来源于真实搜索引擎。数据集通过专家标注者提供4级细粒度相关性评分,以提高评估的准确性。T2Ranking不仅支持文本查询和段落数据,还提供了查询类型和文档的XML文件等辅助资源,以促进进一步研究。数据集的应用领域包括问答和阅读理解,旨在通过提高段落排序的准确性,增强信息检索系统的性能。
提供机构:
清华大学
创建时间:
2023-04-07



