orpo-explorers/OHP-15k

Name: orpo-explorers/OHP-15k
Creator: orpo-explorers
Published: 2024-04-22 11:25:11
License: 暂无描述

Hugging Face2024-04-22 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/orpo-explorers/OHP-15k

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: source dtype: string - name: category dtype: class_label: names: '0': agent '1': awareness '2': card '3': coding '4': cot '5': counterfactual_contextual '6': detailed_writing '7': editor '8': experience '9': general '10': greeting '11': gtkm '12': joke '13': misconception '14': multiple_choice '15': orca '16': plan '17': quiz '18': riddle '19': roleplay '20': rp '21': song '22': stylized_response '23': summarization '24': theory_of_mind '25': trivia '26': uncategorized '27': wordgame '28': writing - name: prompt dtype: string - name: candidates_completions sequence: string - name: candidate_policies sequence: string - name: ranks sequence: int64 - name: rank_str dtype: string - name: chosen_policy dtype: string - name: chosen list: - name: content dtype: string - name: role dtype: string - name: rejected_policy dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string splits: - name: train num_bytes: 113126067.42724837 num_examples: 15404 download_size: 56723149 dataset_size: 113126067.42724837 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征字段： - 名称：来源数据类型：字符串 - 名称：类别数据类型：类别标签（class_label）：类别映射： '0': 智能体（agent） '1': 认知感知 '2': 卡片类任务 '3': 代码生成 '4': 思维链（Chain-of-Thought，CoT） '5': 反事实语境类 '6': 精细写作 '7': 编辑润色 '8': 经验分享类 '9': 通用类 '10': 问候类 '11': gtkm '12': 笑话生成 '13': 误区纠正 '14': 多项选择 '15': orca '16': 规划制定 '17': 小测验 '18': 谜语创作 '19': 角色扮演 '20': 角色扮演（Roleplay，缩写RP） '21': 歌曲创作 '22': 风格化回复 '23': 文本摘要 '24': 心理理论（Theory of Mind） '25': 知识问答 '26': 未分类 '27': 文字游戏 '28': 通用写作 - 名称：提示词（prompt）数据类型：字符串 - 名称：候选补全文本序列数据类型：字符串序列 - 名称：候选策略序列数据类型：字符串序列 - 名称：排序分值序列数据类型：64位整数序列 - 名称：排序字符串数据类型：字符串 - 名称：选中策略数据类型：字符串 - 名称：选中回复子列表： - 名称：内容数据类型：字符串 - 名称：角色数据类型：字符串 - 名称：被拒策略数据类型：字符串 - 名称：被拒回复子列表： - 名称：内容数据类型：字符串 - 名称：角色数据类型：字符串数据集划分： - 名称：训练集占用字节数：113126067.42724837 样本数量：15404 下载总大小：56723149 数据集总占用字节数：113126067.42724837 配置项： - 配置名称：默认配置数据文件： - 划分集：训练集文件路径：data/train-*

提供机构：

orpo-explorers

原始信息汇总

数据集概述

数据集特征

source: 数据类型为字符串。
category: 数据类型为分类标签，包含以下类别：
- agent
- awareness
- card
- coding
- cot
- counterfactual_contextual
- detailed_writing
- editor
- experience
- general
- greeting
- gtkm
- joke
- misconception
- multiple_choice
- orca
- plan
- quiz
- riddle
- roleplay
- rp
- song
- stylized_response
- summarization
- theory_of_mind
- trivia
- uncategorized
- wordgame
- writing
prompt: 数据类型为字符串。
candidates_completions: 数据类型为字符串序列。
candidate_policies: 数据类型为字符串序列。
ranks: 数据类型为整数序列。
rank_str: 数据类型为字符串。
chosen_policy: 数据类型为字符串。
chosen: 列表类型，包含：
- content: 数据类型为字符串。
- role: 数据类型为字符串。
rejected_policy: 数据类型为字符串。
rejected: 列表类型，包含：
- content: 数据类型为字符串。
- role: 数据类型为字符串。

数据集分割

train:
- 数据量: 113126067.42724837 字节
- 示例数量: 15404

数据集大小

下载大小: 56723149 字节
数据集大小: 113126067.42724837 字节

配置

config_name: default
- data_files:
  - split: train
    - path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集