five

YYYYYYibo/ultrafeedback_binarized_imp_sam_train_part_3

收藏
Hugging Face2024-07-11 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/YYYYYYibo/ultrafeedback_binarized_imp_sam_train_part_3
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个文本相关的特征,如提示、提示ID、消息列表、选择的分数、拒绝的分数、参考响应、选择的消息和拒绝的消息。这些特征可能用于评估或训练模型,特别是在需要比较不同响应或消息的场景中。数据集的分割为train_prefs,包含19635个例子,总大小为158397402字节。

This dataset includes multiple text-related features such as prompt, prompt ID, messages list, score for chosen responses, score for rejected responses, reference response, chosen messages, and rejected messages. These features might be used for evaluating or training models, especially in scenarios requiring comparison between different responses or messages. The dataset is split into train_prefs, containing 19635 examples with a total size of 158397402 bytes.
提供机构:
YYYYYYibo
原始信息汇总

数据集概述

数据集信息

  • 特征:

    • prompt: 字符串类型
    • prompt_id: 字符串类型
    • messages: 列表类型,包含以下字段:
      • content: 字符串类型
      • role: 字符串类型
    • score_chosen: 浮点数类型
    • score_rejected: 浮点数类型
    • reference_response: 字符串类型
    • chosen: 列表类型,包含以下字段:
      • content: 字符串类型
      • role: 字符串类型
    • rejected: 列表类型,包含以下字段:
      • content: 字符串类型
      • role: 字符串类型
  • 分割:

    • train_prefs:
      • 字节数: 158397402
      • 样本数: 19635
  • 下载大小: 86504299 字节

  • 数据集大小: 158397402 字节

配置

  • 配置名称: default
    • 数据文件:
      • train_prefs:
        • 路径: data/train_prefs-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作