five

datasciathlete/corpus4everyone-klue-xsmall3-korean-balance-NER

收藏
Hugging Face2024-03-11 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/datasciathlete/corpus4everyone-klue-xsmall3-korean-balance-NER
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个主要特征:tokens(字符串序列)和ner_tags(整数序列)。数据集被分为训练集和验证集,其中训练集包含36240个示例,验证集包含9060个示例。数据集的总下载大小为5407329字节,总大小为48321854.0字节。

该数据集包含两个主要特征:tokens(字符串序列)和ner_tags(整数序列)。数据集被分为训练集和验证集,其中训练集包含36240个示例,验证集包含9060个示例。数据集的总下载大小为5407329字节,总大小为48321854.0字节。
提供机构:
datasciathlete
原始信息汇总

数据集概述

数据集特征

  • tokens: 序列类型为字符串(string)。
  • ner_tags: 序列类型为整数(int64)。

数据集分割

  • 训练集(train):
    • 示例数量: 36240
    • 数据大小: 38657483.2字节
  • 验证集(validation):
    • 示例数量: 9060
    • 数据大小: 9664370.8字节

数据集大小

  • 下载大小: 5407329字节
  • 总数据集大小: 48321854.0字节

数据文件配置

  • 默认配置(default):
    • 训练集路径: data/train-*
    • 验证集路径: data/validation-*
二维码
社区交流群
二维码
科研交流群
商业服务