fine-tuned/scidocs
收藏Hugging Face2024-05-13 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/fine-tuned/scidocs
下载链接
链接失效反馈官方服务:
资源简介:
数据集“学术搜索科学论文”是一个生成的数据集,旨在支持开发特定领域的嵌入模型以用于检索任务。
数据集“学术搜索科学论文”是一个生成的数据集,旨在支持开发特定领域的嵌入模型以用于检索任务。
提供机构:
fine-tuned
原始信息汇总
scidocs Dataset 概述
数据集基本信息
- 许可证: Apache-2.0
- 任务类别:
- 特征提取
- 句子相似度
- 语言: 英语
- 标签:
- sentence-transformers
- 特征提取
- 句子相似度
- mteb
- 科学
- 研究
- 学术
- 创新
- 技术
- 数据集大小类别: n<1K
数据集描述
"学术搜索科学论文"数据集是一个专门设计用于支持特定领域嵌入模型开发的数据集,主要用于检索任务。
关联模型
该数据集用于训练 scidocs 模型。
使用方法
使用此数据集进行模型训练或评估,可以通过 Hugging Face datasets 库加载数据集,示例代码如下:
python from datasets import load_dataset
dataset = load_dataset("fine-tuned/scidocs") print(dataset[test][0])



