five

Louieworth/hh-rlhf-trl-style

收藏
Hugging Face2024-04-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Louieworth/hh-rlhf-trl-style
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: chosen list: - name: content dtype: string - name: role dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string - name: prompt dtype: string splits: - name: train num_bytes: 73026 num_examples: 50 - name: test num_bytes: 62643 num_examples: 50 download_size: 87072 dataset_size: 135669 configs: - config_name: default data_files: - split: train path: data/train-* - split: test path: data/test-* --- # TRL's Anthropic HH Dataset We preprocess the dataset using our standard `prompt, chosen, rejected` format. ## Reproduce this dataset 1. Download the `anthropic_hh.py` from the https://huggingface.co/datasets/Louieworth/hh-rlhf-trl-style/tree/0.1.0. 2. Run `python examples/datasets/anthropic_hh.py --debug --push_to_hub`
提供机构:
Louieworth
原始信息汇总

数据集概述

数据集特征

  • chosen
    • content: 数据类型为字符串
    • role: 数据类型为字符串
  • rejected
    • content: 数据类型为字符串
    • role: 数据类型为字符串
  • prompt: 数据类型为字符串

数据集分割

  • train
    • num_bytes: 73026
    • num_examples: 50
  • test
    • num_bytes: 62643
    • num_examples: 50

数据集大小

  • download_size: 87072
  • dataset_size: 135669

配置文件

  • config_name: default
    • data_files
      • split: train, path: data/train-*
      • split: test, path: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作