KnutJaegersberg/orca-wizardlm-v1-clustered
收藏Hugging Face2023-09-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KnutJaegersberg/orca-wizardlm-v1-clustered
下载链接
链接失效反馈官方服务:
资源简介:
该数据集使用了orca-wizardlm数据集中的系统指令,并附加了原始的进化指令响应和两种聚类解决方案。其中,dolphin聚类仅针对指令,使用了sgpt方法和dolphin-7b模型;GTE聚类则针对指令和响应,作为粗略的主题映射。这些聚类解决方案用于按主题对数据集进行下采样,同时保留‘进化指令’的聚类。
提供机构:
KnutJaegersberg
原始信息汇总
数据集概述
许可证
- 该数据集使用 cc-by-nc-4.0 许可证。
数据内容
- 该数据集基于 orca-wizardlm 数据集的系统指令,并附加了原始的进化指令响应和两种聚类解决方案。
聚类解决方案
-
Dolphin 聚类
- 仅针对指令进行聚类,使用 sgpt 方法和 dolphin-7b 模型。
-
GTE 聚类
- 针对指令和响应进行聚类,作为粗略的主题映射。
数据处理
- 使用这些聚类解决方案按主题对数据集进行降采样,同时保留“进化指令”的聚类。



