distilabel-internal-testing/deita-colab
收藏Hugging Face2024-03-27 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/deita-colab
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过Distilabel工具生成的,包含一个`pipeline.yaml`文件,可以用于在Distilabel中重现生成数据集的流程。数据集的示例结构包括`answer`、`completion`、`conversation`、`deita_score`等字段,其中`conversation`字段包含用户和助手之间的对话内容。
该数据集是通过Distilabel工具生成的,包含一个`pipeline.yaml`文件,可以用于在Distilabel中重现生成数据集的流程。数据集的示例结构包括`answer`、`completion`、`conversation`、`deita_score`等字段,其中`conversation`字段包含用户和助手之间的对话内容。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
基本信息
- 大小分类: 小于1K
- 配置名称:
- deita_filtering
- 标签:
- synthetic
- distilabel
- rlaif
数据集结构
配置: deita_filtering
json { "answer": "...", "completion": "...", "conversation": [ { "content": "...", "role": "user" }, { "content": "...", "role": "assistant" } ], "deita_score": 49.0, "deita_score_computed_with": [ "evol_instruction_score", "evol_response_score" ], "embedding": [...] }
使用方法
-
重现管道: console distilabel pipeline run --config "https://huggingface.co/datasets/distilabel-internal-testing/deita-colab/raw/main/pipeline.yaml"
-
探索配置: console distilabel pipeline info --config "https://huggingface.co/datasets/distilabel-internal-testing/deita-colab/raw/main/pipeline.yaml"



