five

sentence-transformers/pubmedqa

收藏
Hugging Face2024-06-19 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/sentence-transformers/pubmedqa
下载链接
链接失效反馈
官方服务:
资源简介:
PubMedQA数据集是一个用于训练BGE-M3模型的数据集,包含三个子集:triplet、triplet-20和triplet-all。每个子集都包含anchor、positive和negative列,数据类型均为字符串。triplet子集包含一个正例和一个负例,triplet-20子集包含一个正例和20个负例,triplet-all子集则包含一个正例和所有负例。数据集的收集策略是从Shitao/bge-m3-data中的PubMedQA jsonl文件中读取数据,并根据不同的子集需求进行筛选。数据集未进行去重处理。

PubMedQA数据集是一个用于训练BGE-M3模型的数据集,包含三个子集:triplet、triplet-20和triplet-all。每个子集都包含anchor、positive和negative列,数据类型均为字符串。triplet子集包含一个正例和一个负例,triplet-20子集包含一个正例和20个负例,triplet-all子集则包含一个正例和所有负例。数据集的收集策略是从Shitao/bge-m3-data中的PubMedQA jsonl文件中读取数据,并根据不同的子集需求进行筛选。数据集未进行去重处理。
提供机构:
sentence-transformers
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作