naorm/dnrti-cyner-ner-512
收藏Hugging Face2024-01-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/naorm/dnrti-cyner-ner-512
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: Type
dtype: string
- name: Text
dtype: string
- name: Fixed Text
dtype: string
- name: Score
dtype: float64
- name: Original Sentence ID
dtype: int64
- name: Original Sentence
dtype: string
- name: Decoded Sentence
dtype: string
- name: __index_level_0__
dtype: int64
splits:
- name: train
num_bytes: 29871163
num_examples: 9380
download_size: 1534698
dataset_size: 29871163
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:类型(Type),数据类型:字符串型
- 名称:文本(Text),数据类型:字符串型
- 名称:修正文本(Fixed Text),数据类型:字符串型
- 名称:得分(Score),数据类型:双精度浮点数(float64)
- 名称:原句子ID(Original Sentence ID),数据类型:整型(int64)
- 名称:原句子(Original Sentence),数据类型:字符串型
- 名称:解码后句子(Decoded Sentence),数据类型:字符串型
- 名称:索引层级0(__index_level_0__),数据类型:整型(int64)
数据划分:
- 名称:训练集(train),字节数:29871163,样本量:9380
下载大小:1534698
数据集总大小:29871163
配置项:
- 配置名称:默认配置(default),数据文件:
- 数据划分:训练集(train),路径:data/train-*
提供机构:
naorm
原始信息汇总
数据集概述
数据集特征
- Type: 字符串类型
- Text: 字符串类型
- Fixed Text: 字符串类型
- Score: 浮点数类型
- Original Sentence ID: 整数类型
- Original Sentence: 字符串类型
- Decoded Sentence: 字符串类型
- index_level_0: 整数类型
数据集划分
- train: 包含9380个样本,占用29871163字节
数据集大小
- 下载大小: 1534698字节
- 数据集大小: 29871163字节
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*



