five

seongil-dn/seongil-dn_mteb-stackexchange-title-body_perc

收藏
Hugging Face2025-03-05 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/seongil-dn/seongil-dn_mteb-stackexchange-title-body_perc
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含查询及其相关和不相关样本的数据集。数据集由id(唯一标识符)、query(查询文本)、positives(相关样本列表,包含id、score(相关性得分)、text(样本文本))以及negatives(不相关样本列表,包含id、score、text以及topk_rank(样本在top-k排序中的位置))组成。数据集分为训练集,其中包含228542个示例,大小为3.47GB。

This dataset contains queries along with their relevant and irrelevant samples. The dataset consists of id (unique identifier), query (query text), positives (a list of relevant samples, including id, score (relevance score), text (sample text)), and negatives (a list of irrelevant samples, including id, score, text, and topk_rank (the position of the sample in the top-k ranking)). The dataset is split into a training set, which contains 228,542 examples and is 3.47GB in size.
提供机构:
seongil-dn
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作