five

weaviate/hard-questions-enronqa

收藏
Hugging Face2025-08-22 更新2025-09-13 收录
下载链接:
https://hf-mirror.com/datasets/weaviate/hard-questions-enronqa
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含138个问题的数据集,这些问题在使用cross encoder模型时能够达到recall @ 5的指标,但未能达到recall @ 1。数据集中的候选文档已经过预处理,使用了摘要推理来总结候选文档与查询的相关性,以减少输入长度并提高recall @ 1的指标。该数据集是从EnronQA数据集中抽样而来。

This dataset contains 138 questions where a cross encoder was able to achieve recall @ 5, but not recall @ 1. The candidate documents have been preprocessed with a summarization inference to summarize the relevance of the candidate document with respect to the query, which reduces the input length of the emails and significantly improves recall @ 1. The dataset is sampled from the EnronQA dataset.
提供机构:
weaviate
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作