datasciathlete/aihub-korean
收藏Hugging Face2024-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/datasciathlete/aihub-korean
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本数据,并标注了实体提及、实体类型和跨度信息。数据集分为训练集和验证集,训练集有82380个示例,验证集有20595个示例。数据集的下载大小为19445128字节,总大小为41366119.0字节。
该数据集包含文本数据,并标注了实体提及、实体类型和跨度信息。数据集分为训练集和验证集,训练集有82380个示例,验证集有20595个示例。数据集的下载大小为19445128字节,总大小为41366119.0字节。
提供机构:
datasciathlete
原始信息汇总
数据集概述
特征信息
- entities
- entity_mentions: 字符串序列
- entity_type: 字符串类型
- spans: 整数序列的序列
- text: 字符串类型
数据分割
- train
- 字节数: 33092895.2
- 样本数: 82380
- validation
- 字节数: 8273223.8
- 样本数: 20595
数据集大小
- 下载大小: 19445128
- 数据集大小: 41366119.0
配置信息
- default
- train: data/train-*
- validation: data/validation-*



