five

librarian-bots/model-card-sentences-annotated

收藏
Hugging Face2023-11-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/librarian-bots/model-card-sentences-annotated
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个配置:原始数据和清洗后的数据,分别存储在results.jsonl和clean_results.jsonl文件中。数据集的任务类别为token分类,标签为文档,名称为Model Card Sentences Annotated with Entities,语言为英语,数据规模在10万到100万之间。

该数据集包含两个配置:原始数据和清洗后的数据,分别存储在results.jsonl和clean_results.jsonl文件中。数据集的任务类别为token分类,标签为文档,名称为Model Card Sentences Annotated with Entities,语言为英语,数据规模在10万到100万之间。
提供机构:
librarian-bots
原始信息汇总

数据集概述

配置信息

  • 原始数据配置:
    • 配置名称: raw_data
    • 数据文件: results.jsonl
  • 清洗后数据配置:
    • 配置名称: cleaned_data
    • 数据文件: clean_results.jsonl

任务类别

  • 标记分类 (token-classification)

标签

  • 文档 (documentation)

数据集名称

  • Model Card Sentences Annotated with Entities

语言

  • 英语 (en)

数据集大小

  • 100K至1M条记录 (100K<n<1M)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作