five

dmayhem93/self-critiquing-critique-and-refine

收藏
Hugging Face2023-04-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dmayhem93/self-critiquing-critique-and-refine
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: id dtype: string - name: source_id dtype: string - name: split dtype: string - name: time dtype: float64 - name: labeler dtype: string - name: is_topic_based_summarization dtype: bool - name: category dtype: string - name: severity dtype: int64 - name: text_quotes list: - name: begin dtype: int64 - name: end dtype: int64 - name: response_quotes list: - name: begin dtype: int64 - name: end dtype: int64 - name: prompt dtype: string - name: response dtype: string splits: - name: train num_bytes: 170238231 num_examples: 34069 - name: test num_bytes: 26100872 num_examples: 5119 download_size: 27410564 dataset_size: 196339103 --- # Dataset Card for "self-critiquing-critique-and-refine" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息: 特征: - 字段名: id 数据类型: 字符串(string) - 字段名: source_id 数据类型: 字符串(string) - 字段名: split 数据类型: 字符串(string),表示数据集划分标识 - 字段名: time 数据类型: float64,表示时间戳 - 字段名: labeler 数据类型: 字符串(string),表示标注人员 - 字段名: is_topic_based_summarization 数据类型: 布尔值(bool),表示是否为基于主题的摘要任务(is_topic_based_summarization) - 字段名: category 数据类型: 字符串(string),表示样本类别 - 字段名: severity 数据类型: int64,表示严重程度 - 字段名: text_quotes 数据类型: 列表类型,其子字段为: - 字段名: begin 数据类型: int64,表示引用起始位置 - 字段名: end 数据类型: int64,表示引用结束位置 - 字段名: response_quotes 数据类型: 列表类型,其子字段为: - 字段名: begin 数据类型: int64,表示回复引用起始位置 - 字段名: end 数据类型: int64,表示回复引用结束位置 - 字段名: prompt 数据类型: 字符串(string),表示提示词(prompt) - 字段名: response 数据类型: 字符串(string),表示回复内容 数据集划分: - 划分名称: train 字节占用量: 170238231 样本数量: 34069 - 划分名称: test 字节占用量: 26100872 样本数量: 5119 下载大小: 27410564 数据集总大小: 196339103 --- # 「self-critiquing-critique-and-refine」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
dmayhem93
原始信息汇总

数据集概述

数据集名称

"self-critiquing-critique-and-refine"

数据集特征

  • id: 字符串类型
  • source_id: 字符串类型
  • split: 字符串类型
  • time: 浮点数类型
  • labeler: 字符串类型
  • is_topic_based_summarization: 布尔类型
  • category: 字符串类型
  • severity: 整数类型
  • text_quotes: 列表类型,包含两个子特征:
    • begin: 整数类型
    • end: 整数类型
  • response_quotes: 列表类型,包含两个子特征:
    • begin: 整数类型
    • end: 整数类型
  • prompt: 字符串类型
  • response: 字符串类型

数据集分割

  • 训练集:
    • 数据量: 170238231字节
    • 样本数: 34069
  • 测试集:
    • 数据量: 26100872字节
    • 样本数: 5119

数据集大小

  • 下载大小: 27410564字节
  • 数据集总大小: 196339103字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作