five

T2Ranking

收藏
arXiv2023-04-07 更新2024-06-21 收录
下载链接:
https://github.com/THUIR/T2Ranking/
下载链接
链接失效反馈
官方服务:
资源简介:
T2Ranking是由清华大学和腾讯公司合作开发的大型中文段落排序数据集,旨在解决中文信息检索领域中数据集规模小、相关性标注粗糙和假阴性问题。该数据集包含超过30万查询和200多万个独特段落,来源于真实搜索引擎。数据集通过专家标注者提供4级细粒度相关性评分,以提高评估的准确性。T2Ranking不仅支持文本查询和段落数据,还提供了查询类型和文档的XML文件等辅助资源,以促进进一步研究。数据集的应用领域包括问答和阅读理解,旨在通过提高段落排序的准确性,增强信息检索系统的性能。
提供机构:
清华大学
创建时间:
2023-04-07
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作