five

SaiGaneshanM/samsung-qa-dataset

收藏
Hugging Face2026-04-05 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/SaiGaneshanM/samsung-qa-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: messages list: - name: role dtype: string - name: content dtype: string - name: session_key dtype: string - name: qa_type dtype: string - name: calculated_facts list: - name: feature dtype: string - name: mean dtype: float64 - name: min dtype: float64 - name: max dtype: float64 - name: std dtype: float64 - name: slope dtype: float64 - name: first_last_change dtype: float64 - name: first_last_change_pct dtype: float64 - name: token_text dtype: string splits: - name: train num_bytes: 284341481 num_examples: 54809 - name: validation num_bytes: 19186093 num_examples: 4234 - name: test num_bytes: 30414552 num_examples: 5346 download_size: 332385194 dataset_size: 333942126 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* - split: test path: data/test-* ---

数据集信息: 特征: - 名称:对话消息 (messages)(列表型),其元素包含两个子特征: - 角色 (role):数据类型为字符串 - 内容 (content):数据类型为字符串 - 名称:会话键 (session_key):数据类型为字符串 - 名称:问答类型 (qa_type):数据类型为字符串 - 名称:计算特征集 (calculated_facts)(列表型),其元素包含以下子特征: - 特征名 (feature):数据类型为字符串 - 均值 (mean):数据类型为float64 - 最小值 (min):数据类型为float64 - 最大值 (max):数据类型为float64 - 标准差 (std):数据类型为float64 - 斜率 (slope):数据类型为float64 - 首尾变化量 (first_last_change):数据类型为float64 - 首尾变化百分比 (first_last_change_pct):数据类型为float64 - 词元文本 (token_text):数据类型为字符串 数据集划分: - 名称:训练集 (train):数据字节数为284341481,样本数量为54809 - 名称:验证集 (validation):数据字节数为19186093,样本数量为4234 - 名称:测试集 (test):数据字节数为30414552,样本数量为5346 下载总大小:332385194 字节,数据集总存储大小:333942126 字节 配置信息: - 配置名称:默认配置 (default),数据文件路径映射如下: - 训练集拆分:对应 data/train-* - 验证集拆分:对应 data/validation-* - 测试集拆分:对应 data/test-*
提供机构:
SaiGaneshanM
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作