five

florianhoenicke/flo

收藏
Hugging Face2024-05-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/florianhoenicke/flo
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - feature-extraction - sentence-similarity language: - en tags: - sentence-transformers - feature-extraction - sentence-similarity - mteb - Debate - Argument - Counterargument - Discussion - Logic pretty_name: general domain size_categories: - n<1K --- # flo Dataset ## Dataset Description The dataset "general domain" is a generated dataset designed to support the development of domain specific embedding models for retrieval tasks. ## Associated Model This dataset was used to train the [**flo**](https://huggingface.co/florianhoenicke/flo) model. ## How to Use To use this dataset for model training or evaluation, you can load it using the Hugging Face `datasets` library as follows: ```python from datasets import load_dataset dataset = load_dataset("florianhoenicke/flo") print(dataset['test'][0]) ```
提供机构:
florianhoenicke
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别:
    • 特征提取
    • 句子相似度
  • 语言: 英语
  • 标签:
    • sentence-transformers
    • feature-extraction
    • sentence-similarity
    • mteb
    • Debate
    • Argument
    • Counterargument
    • Discussion
    • Logic
  • 美观名称: 通用领域
  • 大小类别: n<1K

数据集描述

"通用领域"数据集是一个生成的数据集,旨在支持特定领域嵌入模型的发展,用于检索任务。

关联模型

该数据集用于训练flo模型。

使用方法

使用此数据集进行模型训练或评估,可通过Hugging Face datasets库加载: python from datasets import load_dataset

dataset = load_dataset("florianhoenicke/flo") print(dataset[test][0])

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作