sentence-transformers/coliee
收藏Hugging Face2024-06-19 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/sentence-transformers/coliee
下载链接
链接失效反馈官方服务:
资源简介:
COLIEE数据集包含三个子集:triplet、triplet-20和triplet-all。每个子集都包含anchor、positive和negative列,数据类型均为字符串。triplet子集包含463个训练样本,triplet-20子集包含463个训练样本,每个样本有20个negative,triplet-all子集包含9260个训练样本。数据集的收集策略是从Shitao/bge-m3-data数据集中读取coliee jsonl文件,并根据不同的策略生成样本。数据集未进行去重处理。
COLIEE数据集包含三个子集:triplet、triplet-20和triplet-all。每个子集都包含anchor、positive和negative列,数据类型均为字符串。triplet子集包含463个训练样本,triplet-20子集包含463个训练样本,每个样本有20个negative,triplet-all子集包含9260个训练样本。数据集的收集策略是从Shitao/bge-m3-data数据集中读取coliee jsonl文件,并根据不同的策略生成样本。数据集未进行去重处理。
提供机构:
sentence-transformers



