five

dmayhem93/self-critiquing-helpful-sft

收藏
Hugging Face2023-04-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dmayhem93/self-critiquing-helpful-sft
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: id dtype: string - name: source_id dtype: string - name: split dtype: string - name: time dtype: float64 - name: labeler dtype: string - name: is_topic_based_summarization dtype: bool - name: prompt dtype: string - name: response dtype: string splits: - name: train num_bytes: 68462243 num_examples: 12270 - name: test num_bytes: 8427723 num_examples: 1580 download_size: 11327924 dataset_size: 76889966 --- # Dataset Card for "self-critiquing-helpful-sft" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征列: - 名称:id,数据类型:字符串(string) - 名称:源ID(source_id),数据类型:字符串(string) - 名称:数据集划分(split),数据类型:字符串(string) - 名称:时间(time),数据类型:float64 - 名称:标注者(labeler),数据类型:字符串(string) - 名称:是否基于主题的摘要生成(is_topic_based_summarization),数据类型:布尔值(bool) - 名称:提示词(prompt),数据类型:字符串(string) - 名称:回复(response),数据类型:字符串(string) 子集划分: - 名称:训练集(train),字节数:68462243,样本量:12270 - 名称:测试集(test),字节数:8427723,样本量:1580 下载总大小:11327924,数据集总大小:76889966 --- # 数据集卡片:"self-critiquing-helpful-sft" [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
dmayhem93
原始信息汇总

数据集概述

数据集特征

  • id: 字符串类型
  • source_id: 字符串类型
  • split: 字符串类型
  • time: 浮点数类型
  • labeler: 字符串类型
  • is_topic_based_summarization: 布尔类型
  • prompt: 字符串类型
  • response: 字符串类型

数据集分割

  • 训练集:
    • 示例数量: 12270
    • 数据大小: 68462243 字节
  • 测试集:
    • 示例数量: 1580
    • 数据大小: 8427723 字节

数据集大小

  • 下载大小: 11327924 字节
  • 数据集总大小: 76889966 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作