sentence-transformers/wikipedia-en-sentences

Name: sentence-transformers/wikipedia-en-sentences
Creator: sentence-transformers
Published: 2024-04-25 19:15:05
License: 暂无描述

Hugging Face2024-04-25 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/sentence-transformers/wikipedia-en-sentences

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含787万个英语句子，可用于嵌入模型的知识蒸馏。数据集的列名为sentence，列类型为字符串。数据集的收集策略是从https://sbert.net/datasets/wikipedia-en-sentences.txt.gz下载并上传，未进行进一步修改。数据集未进行去重处理。

提供机构：

sentence-transformers

原始信息汇总

数据集概述

5,000+

优质数据集

54 个

任务类型

进入经典数据集