five

distilabel-internal-testing/deita-colab

收藏
Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/deita-colab
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过Distilabel工具生成的,包含一个`pipeline.yaml`文件,可以用于在Distilabel中重现生成数据集的流程。数据集的示例结构包括`answer`、`completion`、`conversation`、`deita_score`等字段,其中`conversation`字段包含用户和助手之间的对话内容。

该数据集是通过Distilabel工具生成的,包含一个`pipeline.yaml`文件,可以用于在Distilabel中重现生成数据集的流程。数据集的示例结构包括`answer`、`completion`、`conversation`、`deita_score`等字段,其中`conversation`字段包含用户和助手之间的对话内容。
提供机构:
distilabel-internal-testing
原始信息汇总

数据集概述

基本信息

  • 大小分类: 小于1K
  • 配置名称:
    • deita_filtering
  • 标签:
    • synthetic
    • distilabel
    • rlaif

数据集结构

配置: deita_filtering

json { "answer": "...", "completion": "...", "conversation": [ { "content": "...", "role": "user" }, { "content": "...", "role": "assistant" } ], "deita_score": 49.0, "deita_score_computed_with": [ "evol_instruction_score", "evol_response_score" ], "embedding": [...] }

使用方法

  • 重现管道: console distilabel pipeline run --config "https://huggingface.co/datasets/distilabel-internal-testing/deita-colab/raw/main/pipeline.yaml"

  • 探索配置: console distilabel pipeline info --config "https://huggingface.co/datasets/distilabel-internal-testing/deita-colab/raw/main/pipeline.yaml"

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作