SkunkworksAI-shared/concatenated_1
收藏Hugging Face2023-09-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SkunkworksAI-shared/concatenated_1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: conversation_id
dtype: int64
- name: dataset_id
dtype: string
- name: unique_conversation_id
dtype: string
splits:
- name: train
num_bytes: 4580744904
num_examples: 2527636
download_size: 2447560359
dataset_size: 4580744904
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for "concatenated_1"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
dataset_info:
特征:
- 名称: 文本
数据类型: 字符串
- 名称: 对话ID
数据类型: int64
- 名称: 数据集ID
数据类型: 字符串
- 名称: 唯一对话ID
数据类型: 字符串
拆分:
- 名称: 训练集
字节数: 4580744904
样本数: 2527636
下载大小: 2447560359
数据集大小: 4580744904
配置:
- 配置名称: 默认
数据文件:
- 拆分: 训练集
路径: data/train-*
# "concatenated_1"数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
SkunkworksAI-shared
原始信息汇总
数据集概述
数据集信息
- 特征:
text: 数据类型为stringconversation_id: 数据类型为int64dataset_id: 数据类型为stringunique_conversation_id: 数据类型为string
数据分割
- 训练集:
- 名称:
train - 字节数: 4580744904
- 样本数: 2527636
- 名称:
数据集大小
- 下载大小: 2447560359 字节
- 数据集大小: 4580744904 字节
配置
- 配置名称:
default - 数据文件:
- 分割:
train - 路径:
data/train-*
- 分割:



