TeetouchQQ/train_data
收藏Hugging Face2024-01-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TeetouchQQ/train_data
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: instruction
dtype: string
- name: input
dtype: string
- name: output
dtype: string
- name: source
dtype: string
- name: raw_entities
struct:
- name: EMAIL
sequence: string
- name: ID_NUM
sequence: string
- name: NAME_STUDENT
sequence: string
- name: PHONE_NUM
sequence: string
- name: STREET_ADDRESS
sequence: string
- name: URL_PERSONAL
sequence: string
- name: USERNAME
sequence: string
- name: id
dtype: string
splits:
- name: train
num_bytes: 54446342
num_examples: 5785
download_size: 25486709
dataset_size: 54446342
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
TeetouchQQ
原始信息汇总
数据集概述
数据特征
- instruction: 数据类型为字符串。
- input: 数据类型为字符串。
- output: 数据类型为字符串。
- source: 数据类型为字符串。
- raw_entities: 结构化数据,包含以下字段:
- EMAIL: 字符串序列。
- ID_NUM: 字符串序列。
- NAME_STUDENT: 字符串序列。
- PHONE_NUM: 字符串序列。
- STREET_ADDRESS: 字符串序列。
- URL_PERSONAL: 字符串序列。
- USERNAME: 字符串序列。
- id: 数据类型为字符串。
数据分割
- train: 包含5785个样本,总字节数为54446342。
数据集大小
- 下载大小: 25486709字节。
- 数据集大小: 54446342字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。



