five

KnutJaegersberg/orca-wizardlm-v1-clustered

收藏
Hugging Face2023-09-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/KnutJaegersberg/orca-wizardlm-v1-clustered
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集使用了orca-wizardlm数据集中的系统指令,并附加了原始的进化指令响应和两种聚类解决方案。其中,dolphin聚类仅针对指令,使用了sgpt方法和dolphin-7b模型;GTE聚类则针对指令和响应,作为粗略的主题映射。这些聚类解决方案用于按主题对数据集进行下采样,同时保留‘进化指令’的聚类。
提供机构:
KnutJaegersberg
原始信息汇总

数据集概述

许可证

  • 该数据集使用 cc-by-nc-4.0 许可证。

数据内容

  • 该数据集基于 orca-wizardlm 数据集的系统指令,并附加了原始的进化指令响应和两种聚类解决方案。

聚类解决方案

  1. Dolphin 聚类

    • 仅针对指令进行聚类,使用 sgpt 方法和 dolphin-7b 模型。
  2. GTE 聚类

    • 针对指令和响应进行聚类,作为粗略的主题映射。

数据处理

  • 使用这些聚类解决方案按主题对数据集进行降采样,同时保留“进化指令”的聚类。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作