communityai/system_identity_v1
收藏Hugging Face2024-05-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/communityai/system_identity_v1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: source
dtype: string
- name: conversations
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 494515.41705069126
num_examples: 858
- name: test
num_bytes: 5763.582949308756
num_examples: 10
download_size: 59140
dataset_size: 500279.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
---
数据集元信息:
1. 特征字段:
- 字段名:`source`,数据类型:字符串(string)
- 字段名:`conversations`,为列表类型,列表内每个元素包含两个子字段:
* 子字段名:`content`,数据类型:字符串(string)
* 子字段名:`role`,数据类型:字符串(string)
2. 数据划分:
- 训练集(train):字节大小为494515.41705069126,样本数量858
- 测试集(test):字节大小为5763.582949308756,样本数量10
3. 下载总大小:59140
4. 数据集总存储大小:500279.0
5. 配置项:
- 配置名称:默认配置(default),对应数据文件路径如下:
* 训练集划分:对应路径为`data/train-*`
* 测试集划分:对应路径为`data/test-*`
提供机构:
communityai
原始信息汇总
数据集概述
数据集特征
- source:数据类型为字符串。
- conversations:包含以下两个子特征:
- content:数据类型为字符串。
- role:数据类型为字符串。
数据集分割
- 训练集(train):包含858个样本,占用存储空间为494515.41705069126字节。
- 测试集(test):包含10个样本,占用存储空间为5763.582949308756字节。
数据集大小
- 下载大小:59140字节。
- 数据集总大小:500279.0字节。
数据文件配置
- 默认配置(default):
- 训练数据文件:路径为
data/train-*。 - 测试数据文件:路径为
data/test-*。
- 训练数据文件:路径为



