five

fine-tuned/jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp

收藏
Hugging Face2024-08-07 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/fine-tuned/jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 task_categories: - feature-extraction - sentence-similarity language: - en tags: - sentence-transformers - feature-extraction - sentence-similarity - mteb - E-commerce - Cannabis - UK - Scaling - Regulated markets pretty_name: e-commerce for cannabis industry size_categories: - n<1K --- # jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp Dataset ## Dataset Description The dataset "e-commerce for cannabis industry" is a generated dataset designed to support the development of domain specific embedding models for retrieval tasks. ## Associated Model This dataset was used to train the [**jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp**](https://huggingface.co/fine-tuned/jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp) model. ## How to Use To use this dataset for model training or evaluation, you can load it using the Hugging Face `datasets` library as follows: ```python from datasets import load_dataset dataset = load_dataset("fine-tuned/jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp") print(dataset['test'][0]) ```

license: Apache 2.0 任务类别: - 特征提取(feature-extraction) - 句子相似度(sentence-similarity) 语言: - 英语(en) 标签: - 句子Transformer(sentence-transformers) - 特征提取(feature-extraction) - 句子相似度(sentence-similarity) - 大规模文本嵌入基准(MTEB) - 电子商务(E-commerce) - 大麻(Cannabis) - 英国(UK) - 缩放(Scaling) - 受监管市场(Regulated markets) 友好名称: 大麻行业电子商务 数据规模类别: - 样本量小于1000(n<1K) # jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp 数据集 ## 数据集说明 本数据集「大麻行业电子商务」为合成数据集,旨在支撑面向检索任务的领域专用嵌入模型研发。 ## 关联模型 本数据集用于训练模型 [**jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp**](https://huggingface.co/fine-tuned/jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp)。 ## 使用方法 若需将本数据集用于模型训练或评估,可通过Hugging Face的`datasets`库加载,示例代码如下: python from datasets import load_dataset dataset = load_dataset("fine-tuned/jinaai_jina-embeddings-v2-base-en-872024-sz3k-webapp") print(dataset['test'][0])
提供机构:
fine-tuned
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作