cwinkler/green_patents
收藏Hugging Face2023-01-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cwinkler/green_patents
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含标记为1(=绿色)和0(=非绿色)的专利标题。绿色专利标题是通过在Google Patents上搜索CPC类别Y02收集的,而非绿色专利标题则来自HUPD数据集,随机选择了5000个标题。
提供机构:
cwinkler
原始信息汇总
Green patents dataset 概述
基本信息
- 语言: 英语
- 数据集大小: 1K<n<10K
- 任务类型: 文本分类
数据集详情
- 行数: 9145
- 特征:
title(标题)label(标签)
- 标签定义:
0: 非绿色专利1: 绿色专利
数据来源
- 绿色专利: 通过Google Patents搜索CPC类"Y02"获取(查询条件:"status:APPLICATION type:PATENT (Y02) country:EP,US",日期:2023年5月1日)。
- 非绿色专利: 从HUPD数据集随机选取5000个标题,未发现任何以"Y"开头的CPC类专利。
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是一个用于文本分类的专利标题数据集,包含9,145个专利标题,每个标题被标记为绿色(label=1)或非绿色(label=0)。绿色专利通过CPC类别'Y02'筛选而来,而非绿色专利则随机选自HUPD数据集,适用于训练模型进行环保技术相关的专利分类。
以上内容由遇见数据集搜集并总结生成



