新能源产业链结构文本训练数据
收藏浙江省数据知识产权登记平台2026-05-29 更新2026-05-30 收录
下载链接:
https://www.zjip.org.cn/home/announce/trends/8449818
下载链接
链接失效反馈官方服务:
资源简介:
本数据集服务于新能源产业的智能分析与图谱构建,通过精准关联企业信息与多级产业标签,为核心工作提供数据支撑。主要应用于:产业规划,辅助政府及园区洞察太阳能、风能、智能电网等细分领域的设备制造、材料供应与技术服务的分布;市场研判,为投资机构分析光伏设备、储能电池、电力电子元器件等具体赛道竞争格局提供标准化依据;供应链协同,赋能新能源项目方或链主企业,智能匹配从专用材料、核心设备到工程服务的上下游供应商。一、加工前数据说明
本数据集旨在构建用于新能源产业链智能分析的人工智能模型训练语料。在加工前,数据已进行严格的匿名化与去标识化处理。原始企业名称被统一替换为不可逆的规范标识符,简介中的具体地址、联系人等敏感信息已被移除,确保数据完全符合隐私保护与安全合规要求,为模型训练提供了洁净、可靠的输入基础。
二、数据处理规则
数据处理严格遵循“体系先行、业务匹配、特征抽取”的核心规则,并针对新能源产业特点深化了分类层级:1.首先,依据新能源产业分类,预先定义了以“新能源”为根节点,下设“太阳能产业”、“风能产业”、“智能电网产业”、“生物质能及其他新能源产业”等二级节点,并进一步细分为“太阳能设备和生产装备制造”、“智能电力控制设备及电缆制造”等三级节点,直至“泵及真空设备制造”、“电线、电缆制造”、“新能源技术推广服务”等具体的四级节点业态。该多层体系确保了新能源产业从发电、输配到服务全链条分类的逻辑性与精细度。2.业务匹配:采用“自动化规则匹配与人工校验相结合”的策略。首先,依托Spark等大数据处理框架,对海量企业简介文本进行分布式清洗、分词与关键词匹配,通过预构建的新能源产业语义规则库(含“光伏”、“风电”、“储能”、“电缆”、“逆变器”等关键词)自动计算并推荐初步的分类节点。随后,由标注专家对系统推荐结果进行全文语境审核与最终判定,依据企业核心产品与服务(如是否制造光伏电缆、是否提供储能技术服务等),在多层分类体系中进行精准判定和四级节点归类,确保业务匹配的准确性。
3.特征抽取:在完成分类的同时,从企业简介中系统性抽取体现其技术特性、产品属性或业务模式的关键词。在本表中,这一特征直接体现为与分类标签一致的“四级节点”名称,它本身即是一个高度概括的“正向词”,清晰地标定了企业最具体的业务活动。
三、加工后数据内容
加工后的数据集为一条条结构化的“文本-标签”数据。每条数据均包含脱敏后的企业描述文本,以及与之对应、经人工校验的完整产业链分类标签(一级至四级节点)。数据内容覆盖了从光伏材料、风电装备、智能电缆到新能源技术推广等新能源全产业链的多个关键环节,形成了一个分类体系层次分明、标注精准、直接以四级节点作为核心业务特征的数据集,可直接用于新能源产业精细图谱构建、企业智能分类与供应链分析等模型的训练与评估。
提供机构:
火石创造科技有限公司
创建时间:
2026-01-23
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是用于新能源产业链智能分析的训练数据,包含脱敏后的企业描述文本和精细的多级产业分类标签(如光伏、风电、储能等),覆盖全产业链关键环节,支持产业图谱构建、企业分类与供应链分析。数据经过严格匿名化处理,并采用自动化与人工校验结合的方式确保分类准确性,适用于政府规划、投资研判和上下游匹配等场景。
以上内容由遇见数据集搜集并总结生成



