j-chim/pii-pile-chunk3-0-50000-tagged
收藏Hugging Face2023-01-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/j-chim/pii-pile-chunk3-0-50000-tagged
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本、元数据、分数等信息,分为训练集,共有50000个例子,数据集总大小为505187810字节,下载大小为192707833字节。
提供机构:
j-chim
原始信息汇总
数据集概述
数据集名称
- 名称: pii-pile-chunk3-0-50000-tagged
数据集特征
- texts: 字符串序列
- meta: 结构化数据
- pile_set_name: 字符串类型
- scores: 浮点数序列(float64)
- avg_score: 浮点数类型(float64)
- num_sents: 整数类型(int64)
- tagged_pii_results: 列表
- analysis_explanation: 空值(null)
- end: 整数类型(int64)
- entity_type: 字符串类型
- recognition_metadata: 结构化数据
- recognizer_identifier: 字符串类型
- recognizer_name: 字符串类型
- score: 浮点数类型(float64)
- start: 整数类型(int64)
数据集分割
- train:
- num_bytes: 505187810
- num_examples: 50000
数据集大小
- download_size: 192707833
- dataset_size: 505187810



