five

webis/tip-of-my-tongue-known-item-search

收藏
Hugging Face2026-02-25 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/webis/tip-of-my-tongue-known-item-search
下载链接
链接失效反馈
官方服务:
资源简介:
TOMT-KIS数据集是一个包含128万个已知项目问题的大规模数据集,来源于Reddit的r/tipofmytongue子论坛。该数据集用于研究用户在搜索引擎无法解决已知信息需求时,如何在问答平台上发布问题以寻求帮助。数据集以JSONL格式提供,每个问题包含129个属性,如唯一标识符、标题、内容、时间戳、评论等。对于被标记为已解决的问题,还添加了四个新属性来标识答案,包括答案检测、解决时间、选择的答案和答案路径上的链接。

The TOMT-KIS (tip-of-my-tongue-known-item-search) dataset is a large-scale dataset of 1.28 million known-item questions from the r/tipofmytongue subreddit. It is primarily used for known-item question performance prediction research. The dataset is provided in JSONL format and includes 129 attributes such as question ID, title, content, posting time, comments, etc.
提供机构:
webis
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作