five

Deojoandco/capstone_fromgpt_without_gold_v4

收藏
Hugging Face2023-11-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Deojoandco/capstone_fromgpt_without_gold_v4
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: dialog_id dtype: int64 - name: dialogue dtype: string - name: summary dtype: string - name: gold_tags dtype: string - name: gpt_success dtype: bool - name: gpt_response dtype: string - name: gold_tags_tokens_count dtype: int64 - name: GPT_TAGS_FOUND dtype: bool - name: gpt_output_tags dtype: string - name: gpt_output_tag_tokens_count dtype: int64 - name: GPT_MI_FOUND dtype: bool - name: gpt_tags_token_count dtype: int64 - name: gpt_tags dtype: string - name: tag_token_count_match dtype: bool splits: - name: test num_bytes: 20862 num_examples: 12 download_size: 22567 dataset_size: 20862 configs: - config_name: default data_files: - split: test path: data/test-* --- # Dataset Card for "capstone_fromgpt_without_gold_v4" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息: 特征字段: - 名称: 对话ID(dialog_id) 数据类型: 64位整数 - 名称: 对话(dialogue) 数据类型: 字符串 - 名称: 摘要(summary) 数据类型: 字符串 - 名称: 金标准标签(gold_tags) 数据类型: 字符串 - 名称: GPT请求成功状态(gpt_success) 数据类型: 布尔值 - 名称: GPT响应内容(gpt_response) 数据类型: 字符串 - 名称: 金标准标签Token数(gold_tags_tokens_count) 数据类型: 64位整数 - 名称: 是否检出GPT生成标签(GPT_TAGS_FOUND) 数据类型: 布尔值 - 名称: GPT输出标签(gpt_output_tags) 数据类型: 字符串 - 名称: GPT输出标签Token数(gpt_output_tag_tokens_count) 数据类型: 64位整数 - 名称: 是否检出GPT_MI信息(GPT_MI_FOUND) 数据类型: 布尔值 - 名称: GPT标签Token数(gpt_tags_token_count) 数据类型: 64位整数 - 名称: GPT标签(gpt_tags) 数据类型: 字符串 - 名称: 标签Token数匹配状态(tag_token_count_match) 数据类型: 布尔值 数据集划分: - 名称: 测试集(test) 字节大小: 20862 样本数量: 12 下载总大小: 22567 数据集本体大小: 20862 配置项: - 配置名称: 默认配置(default) 数据文件: - 对应划分: 测试集(test) 文件路径: data/test-* --- # 「capstone_fromgpt_without_gold_v4」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Deojoandco
原始信息汇总

数据集概述

数据集信息

特征

  • dialog_id: 数据类型为 int64
  • dialogue: 数据类型为 string
  • summary: 数据类型为 string
  • gold_tags: 数据类型为 string
  • gpt_success: 数据类型为 bool
  • gpt_response: 数据类型为 string
  • gold_tags_tokens_count: 数据类型为 int64
  • GPT_TAGS_FOUND: 数据类型为 bool
  • gpt_output_tags: 数据类型为 string
  • gpt_output_tag_tokens_count: 数据类型为 int64
  • GPT_MI_FOUND: 数据类型为 bool
  • gpt_tags_token_count: 数据类型为 int64
  • gpt_tags: 数据类型为 string
  • tag_token_count_match: 数据类型为 bool

分割

  • test: 字节数为 20862,样本数为 12

大小

  • 下载大小: 22567 字节
  • 数据集大小: 20862 字节

配置

  • config_name: default
    • data_files:
      • split: test
      • path: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作