five

cwinkler/green_patents

收藏
Hugging Face2023-01-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cwinkler/green_patents
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含标记为1(=绿色)和0(=非绿色)的专利标题。绿色专利标题是通过在Google Patents上搜索CPC类别Y02收集的,而非绿色专利标题则来自HUPD数据集,随机选择了5000个标题。
提供机构:
cwinkler
原始信息汇总

Green patents dataset 概述

基本信息

  • 语言: 英语
  • 数据集大小: 1K<n<10K
  • 任务类型: 文本分类

数据集详情

  • 行数: 9145
  • 特征:
    • title (标题)
    • label (标签)
  • 标签定义:
    • 0: 非绿色专利
    • 1: 绿色专利

数据来源

  • 绿色专利: 通过Google Patents搜索CPC类"Y02"获取(查询条件:"status:APPLICATION type:PATENT (Y02) country:EP,US",日期:2023年5月1日)。
  • 非绿色专利: 从HUPD数据集随机选取5000个标题,未发现任何以"Y"开头的CPC类专利。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个用于文本分类的专利标题数据集,包含9,145个专利标题,每个标题被标记为绿色(label=1)或非绿色(label=0)。绿色专利通过CPC类别'Y02'筛选而来,而非绿色专利则随机选自HUPD数据集,适用于训练模型进行环保技术相关的专利分类。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作