five

yl2342/friends_chandler_bing_sarcasm

收藏
Hugging Face2024-05-08 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/yl2342/friends_chandler_bing_sarcasm
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit dataset_info: - config_name: default features: - name: Chandler_quote dtype: string - name: Context dtype: string - name: Sarcasm dtype: bool - name: Reason dtype: string - name: Unlike_chandler_sarcastic dtype: string - name: Unlike_chandler_sincere dtype: string - name: episode dtype: string splits: - name: train num_bytes: 939767 num_examples: 1978 download_size: 535021 dataset_size: 939767 - config_name: instruct features: - name: text dtype: string splits: - name: train num_bytes: 1043202 num_examples: 1978 download_size: 318166 dataset_size: 1043202 - config_name: preference_chat features: - name: chosen list: - name: content dtype: string - name: role dtype: string - name: rejected list: - name: content dtype: string - name: role dtype: string - name: prompt dtype: string splits: - name: train num_bytes: 3082610 num_examples: 1978 download_size: 781005 dataset_size: 3082610 - config_name: preference_raw features: - name: system dtype: string - name: context dtype: string - name: chosen dtype: string - name: rejected dtype: string splits: - name: train num_bytes: 1128834 num_examples: 1978 download_size: 344879 dataset_size: 1128834 configs: - config_name: default data_files: - split: train path: data/train-* - config_name: instruct data_files: - split: train path: instruct/train-* - config_name: preference_chat data_files: - split: train path: preference_chat/train-* - config_name: preference_raw data_files: - split: train path: preference_raw/train-* ---
提供机构:
yl2342
原始信息汇总

数据集概述

配置名称:default

  • 特征信息:
    • Chandler_quote: 字符串类型
    • Context: 字符串类型
    • Sarcasm: 布尔类型
    • Reason: 字符串类型
    • Unlike_chandler_sarcastic: 字符串类型
    • Unlike_chandler_sincere: 字符串类型
    • episode: 字符串类型
  • 数据分割:
    • 训练集:
      • 数据大小:939767字节
      • 示例数量:1978
      • 下载大小:535021字节
      • 数据集大小:939767字节

配置名称:instruct

  • 特征信息:
    • text: 字符串类型
  • 数据分割:
    • 训练集:
      • 数据大小:1043202字节
      • 示例数量:1978
      • 下载大小:318166字节
      • 数据集大小:1043202字节

配置名称:preference_chat

  • 特征信息:
    • chosen:
      • content: 字符串类型
      • role: 字符串类型
    • rejected:
      • content: 字符串类型
      • role: 字符串类型
    • prompt: 字符串类型
  • 数据分割:
    • 训练集:
      • 数据大小:3082610字节
      • 示例数量:1978
      • 下载大小:781005字节
      • 数据集大小:3082610字节

配置名称:preference_raw

  • 特征信息:
    • system: 字符串类型
    • context: 字符串类型
    • chosen: 字符串类型
    • rejected: 字符串类型
  • 数据分割:
    • 训练集:
      • 数据大小:1128834字节
      • 示例数量:1978
      • 下载大小:344879字节
      • 数据集大小:1128834字节

数据文件路径

  • default配置:
    • 训练集路径:data/train-*
  • instruct配置:
    • 训练集路径:instruct/train-*
  • preference_chat配置:
    • 训练集路径:preference_chat/train-*
  • preference_raw配置:
    • 训练集路径:preference_raw/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作