friendshipkim/sni_english
收藏Hugging Face2024-05-17 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/friendshipkim/sni_english
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: Task
dtype: string
- name: Contributors
dtype: string
- name: Source
list: string
- name: URL
list: string
- name: Categories
list: string
- name: Reasoning
list: string
- name: Definition
list: string
- name: Positive Examples
list:
- name: input
dtype: string
- name: output
dtype: string
- name: explanation
dtype: string
- name: Negative Examples
list:
- name: input
dtype: string
- name: output
dtype: string
- name: explanation
dtype: string
- name: Input_language
list: string
- name: Output_language
list: string
- name: Instruction_language
list: string
- name: Domains
list: string
- name: Instance
struct:
- name: id
dtype: string
- name: input
dtype: string
- name: output
dtype: string
- name: Instance License
list: string
splits:
- name: train
num_bytes: 349908265
num_examples: 75315
- name: validation
num_bytes: 49443206
num_examples: 11805
- name: test
num_bytes: 49494316
num_examples: 11805
download_size: 41613911
dataset_size: 448845787
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
- split: test
path: data/test-*
---
数据集信息:
特征字段:
- 字段名:id,数据类型:字符串
- 字段名:任务(Task),数据类型:字符串
- 字段名:贡献者(Contributors),数据类型:字符串
- 字段名:来源(Source),数据类型:字符串列表
- 字段名:统一资源定位符(URL),数据类型:字符串列表
- 字段名:类别(Categories),数据类型:字符串列表
- 字段名:推理逻辑(Reasoning),数据类型:字符串列表
- 字段名:定义(Definition),数据类型:字符串列表
- 字段名:正例样本(Positive Examples),数据类型:结构体列表,结构体包含以下子字段:
- 字段名:input,数据类型:字符串
- 字段名:output,数据类型:字符串
- 字段名:explanation,数据类型:字符串
- 字段名:负例样本(Negative Examples),数据类型:结构体列表,结构体包含以下子字段:
- 字段名:input,数据类型:字符串
- 字段名:output,数据类型:字符串
- 字段名:explanation,数据类型:字符串
- 字段名:输入语言(Input_language),数据类型:字符串列表
- 字段名:输出语言(Output_language),数据类型:字符串列表
- 字段名:指令语言(Instruction_language),数据类型:字符串列表
- 字段名:应用领域(Domains),数据类型:字符串列表
- 字段名:实例(Instance),数据类型:结构体,结构体包含以下子字段:
- 字段名:id,数据类型:字符串
- 字段名:input,数据类型:字符串
- 字段名:output,数据类型:字符串
- 字段名:实例许可证(Instance License),数据类型:字符串列表
数据集划分(splits):
- 划分名称:train,字节数:349908265,样本数量:75315
- 划分名称:validation,字节数:49443206,样本数量:11805
- 划分名称:test,字节数:49494316,样本数量:11805
下载大小(download_size):41613911,数据集总大小(dataset_size):448845787
配置项(configs):
- 配置名称(config_name):default,数据文件(data_files):
- 划分:train,路径:data/train-*
- 划分:validation,路径:data/validation-*
- 划分:test,路径:data/test-*
提供机构:
friendshipkim
原始信息汇总
数据集概述
数据集特征
- id: 字符串类型
- Task: 字符串类型
- Contributors: 字符串类型
- Source: 字符串列表
- URL: 字符串列表
- Categories: 字符串列表
- Reasoning: 字符串列表
- Definition: 字符串列表
- Positive Examples:
- input: 字符串类型
- output: 字符串类型
- explanation: 字符串类型
- Negative Examples:
- input: 字符串类型
- output: 字符串类型
- explanation: 字符串类型
- Input_language: 字符串列表
- Output_language: 字符串列表
- Instruction_language: 字符串列表
- Domains: 字符串列表
- Instance: 结构体类型,包含:
- id: 字符串类型
- input: 字符串类型
- output: 字符串类型
- Instance License: 字符串列表
数据集分割
- train:
- 字节数: 349908265
- 示例数: 75315
- validation:
- 字节数: 49443206
- 示例数: 11805
- test:
- 字节数: 49494316
- 示例数: 11805
数据集大小
- 下载大小: 41613911字节
- 数据集总大小: 448845787字节
配置文件
- config_name: default
- data_files:
- split: train, path: data/train-*
- split: validation, path: data/validation-*
- split: test, path: data/test-*



