KnutJaegersberg/dolphin_orca_clustered
收藏Hugging Face2023-09-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KnutJaegersberg/dolphin_orca_clustered
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc-by-nc-4.0
---
This dataset is the gpt-4 generated subset of the dolphin / orca dataset, with clusters from:
- gte embeddings
- dolphin-7b sgpt embeddings
- bigbird document embeddings (simsce sentence transformer based, for the whole document)
提供机构:
KnutJaegersberg
原始信息汇总
数据集概述
数据集来源
- 该数据集是从海豚/逆戟鲸数据集中提取的gpt-4生成的子集。
嵌入类型
- gte嵌入
- dolphin-7b sgpt嵌入
- bigbird文档嵌入(基于simsce句子转换器的整个文档嵌入)
许可证
- 该数据集遵循cc-by-nc-4.0许可证。



