five

fine-tuned/scidocs

收藏
Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/fine-tuned/scidocs
下载链接
链接失效反馈
官方服务:
资源简介:
数据集“学术搜索科学论文”是一个生成的数据集,旨在支持开发特定领域的嵌入模型以用于检索任务。

数据集“学术搜索科学论文”是一个生成的数据集,旨在支持开发特定领域的嵌入模型以用于检索任务。
提供机构:
fine-tuned
原始信息汇总

scidocs Dataset 概述

数据集基本信息

  • 许可证: Apache-2.0
  • 任务类别:
    • 特征提取
    • 句子相似度
  • 语言: 英语
  • 标签:
    • sentence-transformers
    • 特征提取
    • 句子相似度
    • mteb
    • 科学
    • 研究
    • 学术
    • 创新
    • 技术
  • 数据集大小类别: n<1K

数据集描述

"学术搜索科学论文"数据集是一个专门设计用于支持特定领域嵌入模型开发的数据集,主要用于检索任务。

关联模型

该数据集用于训练 scidocs 模型。

使用方法

使用此数据集进行模型训练或评估,可以通过 Hugging Face datasets 库加载数据集,示例代码如下:

python from datasets import load_dataset

dataset = load_dataset("fine-tuned/scidocs") print(dataset[test][0])

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作