AlanYky/phi-2-symbol-100k
收藏Hugging Face2024-03-29 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/AlanYky/phi-2-symbol-100k
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: task
dtype: string
- name: inputs
dtype: string
- name: targets
dtype: string
- name: symbols
sequence: string
splits:
- name: train
num_bytes: 288043844.4890984
num_examples: 100000
- name: validation
num_bytes: 28202194.388777554
num_examples: 10000
download_size: 148098768
dataset_size: 316246038.877876
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
数据集信息(dataset_info):
特征(features):
- 字段名:任务(task),数据类型:字符串(string)
- 字段名:输入项(inputs),数据类型:字符串(string)
- 字段名:目标项(targets),数据类型:字符串(string)
- 字段名:符号序列(symbols),数据类型:字符串序列(sequence: string)
数据集划分(splits):
- 划分名称:训练集(train),字节数:288043844.4890984,样本数量:100000
- 划分名称:验证集(validation),字节数:28202194.388777554,样本数量:10000
下载总大小(download_size):148098768 字节
数据集总占用大小(dataset_size):316246038.877876 字节
配置项(configs):
- 配置名称:默认配置(default),数据文件:
- 训练集(train)对应路径:data/train-*
- 验证集(validation)对应路径:data/validation-*
提供机构:
AlanYky
原始信息汇总
数据集概述
数据集特征
- task: 数据类型为字符串
- inputs: 数据类型为字符串
- targets: 数据类型为字符串
- symbols: 数据类型为字符串序列
数据集划分
- 训练集 (train):
- 数据量: 100000个样本
- 存储大小: 288043844.4890984字节
- 验证集 (validation):
- 数据量: 10000个样本
- 存储大小: 28202194.388777554字节
数据集大小
- 下载大小: 148098768字节
- 总数据集大小: 316246038.877876字节
数据文件配置
- 默认配置 (default):
- 训练集路径:
data/train-* - 验证集路径:
data/validation-*
- 训练集路径:



