Deojoandco/capstone_fromgpt_without_gold_v4
收藏Hugging Face2023-11-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Deojoandco/capstone_fromgpt_without_gold_v4
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: dialog_id
dtype: int64
- name: dialogue
dtype: string
- name: summary
dtype: string
- name: gold_tags
dtype: string
- name: gpt_success
dtype: bool
- name: gpt_response
dtype: string
- name: gold_tags_tokens_count
dtype: int64
- name: GPT_TAGS_FOUND
dtype: bool
- name: gpt_output_tags
dtype: string
- name: gpt_output_tag_tokens_count
dtype: int64
- name: GPT_MI_FOUND
dtype: bool
- name: gpt_tags_token_count
dtype: int64
- name: gpt_tags
dtype: string
- name: tag_token_count_match
dtype: bool
splits:
- name: test
num_bytes: 20862
num_examples: 12
download_size: 22567
dataset_size: 20862
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
# Dataset Card for "capstone_fromgpt_without_gold_v4"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 名称: 对话ID(dialog_id)
数据类型: 64位整数
- 名称: 对话(dialogue)
数据类型: 字符串
- 名称: 摘要(summary)
数据类型: 字符串
- 名称: 金标准标签(gold_tags)
数据类型: 字符串
- 名称: GPT请求成功状态(gpt_success)
数据类型: 布尔值
- 名称: GPT响应内容(gpt_response)
数据类型: 字符串
- 名称: 金标准标签Token数(gold_tags_tokens_count)
数据类型: 64位整数
- 名称: 是否检出GPT生成标签(GPT_TAGS_FOUND)
数据类型: 布尔值
- 名称: GPT输出标签(gpt_output_tags)
数据类型: 字符串
- 名称: GPT输出标签Token数(gpt_output_tag_tokens_count)
数据类型: 64位整数
- 名称: 是否检出GPT_MI信息(GPT_MI_FOUND)
数据类型: 布尔值
- 名称: GPT标签Token数(gpt_tags_token_count)
数据类型: 64位整数
- 名称: GPT标签(gpt_tags)
数据类型: 字符串
- 名称: 标签Token数匹配状态(tag_token_count_match)
数据类型: 布尔值
数据集划分:
- 名称: 测试集(test)
字节大小: 20862
样本数量: 12
下载总大小: 22567
数据集本体大小: 20862
配置项:
- 配置名称: 默认配置(default)
数据文件:
- 对应划分: 测试集(test)
文件路径: data/test-*
---
# 「capstone_fromgpt_without_gold_v4」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
Deojoandco
原始信息汇总
数据集概述
数据集信息
特征
- dialog_id: 数据类型为
int64 - dialogue: 数据类型为
string - summary: 数据类型为
string - gold_tags: 数据类型为
string - gpt_success: 数据类型为
bool - gpt_response: 数据类型为
string - gold_tags_tokens_count: 数据类型为
int64 - GPT_TAGS_FOUND: 数据类型为
bool - gpt_output_tags: 数据类型为
string - gpt_output_tag_tokens_count: 数据类型为
int64 - GPT_MI_FOUND: 数据类型为
bool - gpt_tags_token_count: 数据类型为
int64 - gpt_tags: 数据类型为
string - tag_token_count_match: 数据类型为
bool
分割
- test: 字节数为 20862,样本数为 12
大小
- 下载大小: 22567 字节
- 数据集大小: 20862 字节
配置
- config_name: default
- data_files:
- split: test
- path: data/test-*
- data_files:



