librarian-bots/model-card-sentences-annotated
收藏Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/librarian-bots/model-card-sentences-annotated
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:原始数据和清洗后的数据,分别存储在results.jsonl和clean_results.jsonl文件中。数据集的任务类别为token分类,标签为文档,名称为Model Card Sentences Annotated with Entities,语言为英语,数据规模在10万到100万之间。
该数据集包含两个配置:原始数据和清洗后的数据,分别存储在results.jsonl和clean_results.jsonl文件中。数据集的任务类别为token分类,标签为文档,名称为Model Card Sentences Annotated with Entities,语言为英语,数据规模在10万到100万之间。
提供机构:
librarian-bots
原始信息汇总
数据集概述
配置信息
- 原始数据配置:
- 配置名称:
raw_data - 数据文件:
results.jsonl
- 配置名称:
- 清洗后数据配置:
- 配置名称:
cleaned_data - 数据文件:
clean_results.jsonl
- 配置名称:
任务类别
- 标记分类 (
token-classification)
标签
- 文档 (
documentation)
数据集名称
Model Card Sentences Annotated with Entities
语言
- 英语 (
en)
数据集大小
- 100K至1M条记录 (
100K<n<1M)



