five

HyperionHF/tom_clean

收藏
Hugging Face2023-05-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/HyperionHF/tom_clean
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit dataset_info: features: - name: agent dtype: string - name: agent_preferences sequence: string - name: chosen_object dtype: string - name: true_chosen_object dtype: string - name: chosen_object_is_noisy dtype: bool - name: other_objects sequence: string - name: location_chosen_object dtype: int64 - name: location_true_chosen_object dtype: int64 - name: preference_idx dtype: int64 - name: preference_idx_true dtype: int64 - name: example_idx dtype: int64 - name: is_inanimate dtype: bool - name: logical_representation struct: - name: input sequence: string - name: target dtype: string - name: logical_representation_with_indirection struct: - name: input sequence: string - name: target dtype: int64 - name: example_text dtype: string - name: target_idx dtype: int64 - name: matching_animate_inanimate dtype: string - name: matching_animate_inanimate_idx dtype: int64 - name: irrelevant_change_to_original_1 dtype: string - name: irrelevant_change_to_original_1_idx dtype: int64 - name: irrelevant_change_to_original_2 dtype: string - name: irrelevant_change_to_original_2_idx dtype: int64 - name: original_1_with_animate_denotation dtype: string - name: original_1_with_animate_denotation_idx dtype: int64 - name: no_indirection_target dtype: string - name: no_indirection_target_idx dtype: int64 - name: no_indirection_irrelevant_change dtype: string - name: no_indirection_irrelevant_change_idx dtype: int64 - name: no_indirection_target_animate_denotation dtype: string - name: no_indirection_target_animate_denotation_idx dtype: int64 - name: indirection_target dtype: string - name: indirection_target_idx dtype: int64 splits: - name: train num_bytes: 33720360 num_examples: 15579 - name: dev num_bytes: 3748081 num_examples: 1731 - name: test_own_preference num_bytes: 304452 num_examples: 144 - name: test_others_preference num_bytes: 337582 num_examples: 156 - name: test_distraction num_bytes: 318204 num_examples: 144 - name: test_location num_bytes: 732420 num_examples: 336 - name: test_inanimate num_bytes: 970271 num_examples: 450 - name: test_agents num_bytes: 6085350 num_examples: 2808 download_size: 5617164 dataset_size: 46216720 ---
提供机构:
HyperionHF
原始信息汇总

数据集概述

数据集特征

  • agent:字符串类型
  • agent_preferences:字符串序列类型
  • chosen_object:字符串类型
  • true_chosen_object:字符串类型
  • chosen_object_is_noisy:布尔类型
  • other_objects:字符串序列类型
  • location_chosen_object:整数64位类型
  • location_true_chosen_object:整数64位类型
  • preference_idx:整数64位类型
  • preference_idx_true:整数64位类型
  • example_idx:整数64位类型
  • is_inanimate:布尔类型
  • logical_representation:结构类型,包含
    • input:字符串序列类型
    • target:字符串类型
  • logical_representation_with_indirection:结构类型,包含
    • input:字符串序列类型
    • target:整数64位类型
  • example_text:字符串类型
  • target_idx:整数64位类型
  • matching_animate_inanimate:字符串类型
  • matching_animate_inanimate_idx:整数64位类型
  • irrelevant_change_to_original_1:字符串类型
  • irrelevant_change_to_original_1_idx:整数64位类型
  • irrelevant_change_to_original_2:字符串类型
  • irrelevant_change_to_original_2_idx:整数64位类型
  • original_1_with_animate_denotation:字符串类型
  • original_1_with_animate_denotation_idx:整数64位类型
  • no_indirection_target:字符串类型
  • no_indirection_target_idx:整数64位类型
  • no_indirection_irrelevant_change:字符串类型
  • no_indirection_irrelevant_change_idx:整数64位类型
  • no_indirection_target_animate_denotation:字符串类型
  • no_indirection_target_animate_denotation_idx:整数64位类型
  • indirection_target:字符串类型
  • indirection_target_idx:整数64位类型

数据集分割

  • train
    • 字节数:33720360
    • 示例数:15579
  • dev
    • 字节数:3748081
    • 示例数:1731
  • test_own_preference
    • 字节数:304452
    • 示例数:144
  • test_others_preference
    • 字节数:337582
    • 示例数:156
  • test_distraction
    • 字节数:318204
    • 示例数:144
  • test_location
    • 字节数:732420
    • 示例数:336
  • test_inanimate
    • 字节数:970271
    • 示例数:450
  • test_agents
    • 字节数:6085350
    • 示例数:2808

数据集大小

  • 下载大小:5617164字节
  • 数据集大小:46216720字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作