distilabel-internal-testing/fine-preferences-test-3
收藏Hugging Face2024-06-07 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/distilabel-internal-testing/fine-preferences-test-3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具创建的,包含一个`pipeline.yaml`文件,用于重现生成该数据集的流程。数据集的示例结构展示了对话内容,涉及Gamma Ray Bursts (GRBs)对星际介质(ISM)的影响。数据集可以通过Hugging Face的`load_dataset`函数加载。
该数据集是通过distilabel工具创建的,包含一个`pipeline.yaml`文件,用于重现生成该数据集的流程。数据集的示例结构展示了对话内容,涉及Gamma Ray Bursts (GRBs)对星际介质(ISM)的影响。数据集可以通过Hugging Face的`load_dataset`函数加载。
提供机构:
distilabel-internal-testing
原始信息汇总
数据集概述
数据集名称
- 名称: fine-preferences-test-3
数据集创建工具
- 创建工具: distilabel
数据集结构
- 结构: 包含
pipeline.yaml文件,用于通过distilabelCLI重现生成数据集的流程。
数据集示例结构
- 示例结构: 每个示例包含以下字段:
context: 上下文信息conversation: 对话序列,包含多个对话单元,每个单元有content和role字段distilabel_metadata: 元数据信息dump: 数据转储标识file_path: 文件路径id: 唯一标识符int_score: 内部评分language: 语言language_score: 语言评分model_name: 模型名称score: 评分token_count: 令牌计数url: 相关网页链接
数据集加载方式
- 加载方式:
- 通过Python代码加载: python from datasets import load_dataset ds = load_dataset("distilabel-internal-testing/fine-preferences-test-3")
数据集大小与标签
- 大小: n<1K
- 标签:
- synthetic
- distilabel
- rlaif



