five

Jason-Chen/DPO-En-TW-20k

收藏
Hugging Face2024-04-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Jason-Chen/DPO-En-TW-20k
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 dataset_info: - config_name: en features: - name: system dtype: string - name: history list: list: string - name: prompt dtype: string - name: answer list: string - name: en struct: - name: answer sequence: string - name: history sequence: sequence: string - name: prompt dtype: string - name: system dtype: string splits: - name: train num_bytes: 95280806 num_examples: 10000 download_size: 50778351 dataset_size: 95280806 - config_name: zh features: - name: system dtype: string - name: history list: list: string - name: prompt dtype: string - name: answer list: string - name: zh struct: - name: answer sequence: string - name: history sequence: 'null' - name: prompt dtype: string - name: system dtype: string splits: - name: train num_bytes: 52611978 num_examples: 10000 download_size: 31324157 dataset_size: 52611978 configs: - config_name: en data_files: - split: train path: en/train-* - config_name: zh data_files: - split: train path: zh/train-* ---
提供机构:
Jason-Chen
原始信息汇总

数据集概述

数据集配置

英文配置 (en)

  • 特征:
    • system: 数据类型为字符串。
    • history: 列表类型,内部列表为字符串。
    • prompt: 数据类型为字符串。
    • answer: 列表类型,内部为字符串。
    • en: 结构体,包含以下序列:
      • answer: 序列类型,内容为字符串。
      • history: 序列类型,内部序列内容为字符串。
      • prompt: 数据类型为字符串。
      • system: 数据类型为字符串。
  • 分割:
    • train: 大小为95,280,806字节,包含10,000个示例。
  • 下载大小: 50,778,351字节。
  • 数据集大小: 95,280,806字节。

中文配置 (zh)

  • 特征:
    • system: 数据类型为字符串。
    • history: 列表类型,内部列表为字符串。
    • prompt: 数据类型为字符串。
    • answer: 列表类型,内部为字符串。
    • zh: 结构体,包含以下序列:
      • answer: 序列类型,内容为字符串。
      • history: 序列类型,值为null
      • prompt: 数据类型为字符串。
      • system: 数据类型为字符串。
  • 分割:
    • train: 大小为52,611,978字节,包含10,000个示例。
  • 下载大小: 31,324,157字节。
  • 数据集大小: 52,611,978字节。

数据文件

  • 英文配置 (en):
    • train: 文件路径为en/train-*
  • 中文配置 (zh):
    • train: 文件路径为zh/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作