orpo-explorers/OHP-Stratified-3

Name: orpo-explorers/OHP-Stratified-3
Creator: orpo-explorers
Published: 2024-04-22 10:37:07
License: 暂无描述

Hugging Face2024-04-22 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/orpo-explorers/OHP-Stratified-3

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: source dtype: string - name: category dtype: class_label: names: '0': agent '1': awareness '2': card '3': coding '4': cot '5': counterfactual_contextual '6': detailed_writing '7': editor '8': experience '9': general '10': greeting '11': gtkm '12': joke '13': misconception '14': multiple_choice '15': orca '16': plan '17': quiz '18': riddle '19': roleplay '20': rp '21': song '22': stylized_response '23': summarization '24': theory_of_mind '25': trivia '26': uncategorized '27': wordgame '28': writing - name: prompt dtype: string - name: candidates_completions sequence: string - name: candidate_policies sequence: string - name: ranks sequence: int64 - name: rank_str dtype: string - name: chosen_policy dtype: string - name: chosen list: - name: content dtype: string - name: role dtype: string - name: rejected_policy dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string splits: - name: train num_bytes: 2434362224.403847 num_examples: 331479 download_size: 1215587761 dataset_size: 2434362224.403847 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息：特征字段： - 字段名：source 数据类型：字符串 - 字段名：category 数据类型：类别标签（class_label），其类别名称映射为： '0': 智能体（agent） '1': 意识感知（awareness） '2': 卡片（card） '3': 编码（coding） '4': 思维链（Chain of Thought，cot） '5': 反事实上下文（counterfactual_contextual） '6': 精细写作（detailed_writing） '7': 编辑器（editor） '8': 经验（experience） '9': 通用（general） '10': 问候（greeting） '11': gtkm '12': 笑话（joke） '13': 误解纠正（misconception） '14': 多项选择（multiple_choice） '15': orca '16': 规划（plan） '17': 测验（quiz） '18': 谜语（riddle） '19': 角色扮演（roleplay） '20': rp '21': 歌曲（song） '22': 风格化回复（stylized_response） '23': 摘要生成（summarization） '24': 心理理论（Theory of Mind） '25': 琐事问答（trivia） '26': 未分类（uncategorized） '27': 文字游戏（wordgame） '28': 写作（writing） - 字段名：prompt 数据类型：字符串 - 字段名：candidates_completions 数据类型：字符串序列 - 字段名：candidate_policies 数据类型：字符串序列 - 字段名：ranks 数据类型：64位整型序列 - 字段名：rank_str 数据类型：字符串 - 字段名：chosen_policy 数据类型：字符串 - 字段名：chosen 数据类型：列表，包含两个子字段： - 字段名：content，数据类型：字符串 - 字段名：role，数据类型：字符串 - 字段名：rejected_policy 数据类型：字符串 - 字段名：rejected 数据类型：列表，包含两个子字段： - 字段名：content，数据类型：字符串 - 字段名：role，数据类型：字符串数据划分： - 划分名称：train 数据字节数：2434362224.403847 样本数量：331479 下载大小：1215587761字节数据集总大小：2434362224.403847字节配置项： - 配置名称：default 数据文件： - 划分：train 路径：data/train-*

提供机构：

orpo-explorers

原始信息汇总

数据集概述

数据集特征

source: 数据类型为字符串。
category: 数据类型为分类标签，包含以下类别：
- agent
- awareness
- card
- coding
- cot
- counterfactual_contextual
- detailed_writing
- editor
- experience
- general
- greeting
- gtkm
- joke
- misconception
- multiple_choice
- orca
- plan
- quiz
- riddle
- roleplay
- rp
- song
- stylized_response
- summarization
- theory_of_mind
- trivia
- uncategorized
- wordgame
- writing
prompt: 数据类型为字符串。
candidates_completions: 数据类型为字符串序列。
candidate_policies: 数据类型为字符串序列。
ranks: 数据类型为整数序列。
rank_str: 数据类型为字符串。
chosen_policy: 数据类型为字符串。
chosen: 包含以下子特征：
- content: 数据类型为字符串。
- role: 数据类型为字符串。
rejected_policy: 数据类型为字符串。
rejected: 包含以下子特征：
- content: 数据类型为字符串。
- role: 数据类型为字符串。

数据集分割

train:
- 数据量: 2434362224.403847 字节
- 示例数量: 331479

数据集大小

下载大小: 1215587761 字节
数据集大小: 2434362224.403847 字节

配置

config_name: default
data_files:
- split: train
- path: data/train-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集