SaiGaneshanM/samsung-qa-dataset
收藏Hugging Face2026-04-05 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/SaiGaneshanM/samsung-qa-dataset
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: messages
list:
- name: role
dtype: string
- name: content
dtype: string
- name: session_key
dtype: string
- name: qa_type
dtype: string
- name: calculated_facts
list:
- name: feature
dtype: string
- name: mean
dtype: float64
- name: min
dtype: float64
- name: max
dtype: float64
- name: std
dtype: float64
- name: slope
dtype: float64
- name: first_last_change
dtype: float64
- name: first_last_change_pct
dtype: float64
- name: token_text
dtype: string
splits:
- name: train
num_bytes: 284341481
num_examples: 54809
- name: validation
num_bytes: 19186093
num_examples: 4234
- name: test
num_bytes: 30414552
num_examples: 5346
download_size: 332385194
dataset_size: 333942126
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 名称:对话消息 (messages)(列表型),其元素包含两个子特征:
- 角色 (role):数据类型为字符串
- 内容 (content):数据类型为字符串
- 名称:会话键 (session_key):数据类型为字符串
- 名称:问答类型 (qa_type):数据类型为字符串
- 名称:计算特征集 (calculated_facts)(列表型),其元素包含以下子特征:
- 特征名 (feature):数据类型为字符串
- 均值 (mean):数据类型为float64
- 最小值 (min):数据类型为float64
- 最大值 (max):数据类型为float64
- 标准差 (std):数据类型为float64
- 斜率 (slope):数据类型为float64
- 首尾变化量 (first_last_change):数据类型为float64
- 首尾变化百分比 (first_last_change_pct):数据类型为float64
- 词元文本 (token_text):数据类型为字符串
数据集划分:
- 名称:训练集 (train):数据字节数为284341481,样本数量为54809
- 名称:验证集 (validation):数据字节数为19186093,样本数量为4234
- 名称:测试集 (test):数据字节数为30414552,样本数量为5346
下载总大小:332385194 字节,数据集总存储大小:333942126 字节
配置信息:
- 配置名称:默认配置 (default),数据文件路径映射如下:
- 训练集拆分:对应 data/train-*
- 验证集拆分:对应 data/validation-*
- 测试集拆分:对应 data/test-*
提供机构:
SaiGaneshanM



