vinhtran2611/semiconductor_v3.2_filtered_formated
收藏Hugging Face2024-06-14 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/vinhtran2611/semiconductor_v3.2_filtered_formated
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: source
dtype: string
- name: input
dtype: string
- name: instruction
dtype: string
- name: output
dtype: string
- name: text
dtype: string
- name: type
dtype: string
- name: conversations
list:
- name: content
dtype: string
- name: role
dtype: string
splits:
- name: train
num_bytes: 2192116888
num_examples: 166455
download_size: 626251369
dataset_size: 2192116888
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 字段名称:source
数据类型:字符串
- 字段名称:input
数据类型:字符串
- 字段名称:instruction
数据类型:字符串
- 字段名称:output
数据类型:字符串
- 字段名称:text
数据类型:字符串
- 字段名称:type
数据类型:字符串
- 字段名称:conversations
数据类型:列表,其元素包含:
- 字段名称:content
数据类型:字符串
- 字段名称:role
数据类型:字符串
划分集:
- 划分集名称:train
字节数:2192116888
样本数量:166455
下载大小:626251369
数据集占用大小:2192116888
配置项:
- 配置名称:default
数据文件:
- 划分集:train
路径:data/train-*
提供机构:
vinhtran2611



