bdsaglam/webnlg-jerx-sft-mt-ss-openai
收藏Hugging Face2024-04-21 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/bdsaglam/webnlg-jerx-sft-mt-ss-openai
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 13252110
num_examples: 14145
- name: dev
num_bytes: 1680771
num_examples: 1813
- name: test
num_bytes: 2990619
num_examples: 2931
download_size: 5416682
dataset_size: 17923500
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: dev
path: data/dev-*
- split: test
path: data/test-*
---
数据集信息:
特征:
- 字段:messages,类型为列表,列表包含两个子字段:
- 子字段content,数据类型为字符串
- 子字段role,数据类型为字符串
数据划分:
- 划分名称:train(训练集),字节数:13252110,样本数量:14145
- 划分名称:dev(开发集),字节数:1680771,样本数量:1813
- 划分名称:test(测试集),字节数:2990619,样本数量:2931
下载大小:5416682,数据集总大小:17923500
配置项:
- 配置名:default(默认配置),数据文件配置如下:
- 对应train划分:数据路径为data/train-*
- 对应dev划分:数据路径为data/dev-*
- 对应test划分:数据路径为data/test-*
提供机构:
bdsaglam
原始信息汇总
数据集概述
数据集特征
- 名称: messages
- 字段:
- content: 数据类型为字符串
- role: 数据类型为字符串
- 字段:
数据集分割
- 训练集:
- 示例数量: 14145
- 存储大小: 13252110字节
- 开发集:
- 示例数量: 1813
- 存储大小: 1680771字节
- 测试集:
- 示例数量: 2931
- 存储大小: 2990619字节
数据集大小
- 下载大小: 5416682字节
- 总存储大小: 17923500字节
数据文件配置
- 配置名称: default
- 训练集路径: data/train-*
- 开发集路径: data/dev-*
- 测试集路径: data/test-*



