YAGO (Yet Another Great Ontology)|知识图谱数据集|自然语言处理数据集
收藏.png)
- YAGO首次发表,由德国马克斯·普朗克研究所的科研团队开发,旨在整合维基百科和WordNet的知识,构建一个大规模的语义知识库。
- YAGO 1.0版本发布,包含超过100万个实体和500万个事实,标志着该数据集在语义网领域的初步应用。
- YAGO 2.0版本发布,数据集规模扩展至超过1000万个实体和1.2亿个事实,显著提升了其在知识图谱中的应用价值。
- YAGO 3.0版本发布,引入了时间信息和地理信息,使得数据集在时序和地理知识表示方面更加丰富和精确。
- YAGO 4.0版本发布,进一步优化了数据质量和结构,增强了其在自然语言处理和人工智能领域的应用潜力。
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
NLSY (National Longitudinal Survey of Youth)
NLSY是一个长期追踪调查,始于1979年,旨在研究美国年轻人的社会经济和健康状况。该数据集包括受访者的教育、就业、收入、家庭背景、健康状况等多方面的信息,并定期更新以反映受访者的变化。
www.nlsinfo.org 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录
有害气体检测设备调试自动化系统市场集中度评价数据
有害气体检测设备调试自动化系统作为保障工业安全生产、预防重大事故的核心技术装备,在石油化工、矿山开采、市政管网和环保监测等领域发挥着不可替代的作用。特别是在应对有毒有害气体泄漏、爆炸极限预警等高风险场景时,其智能化调试、多参数协同分析的特性,不仅能显著提升检测精度和响应速度,还能通过预防性维护大幅降低安全事故发生率。随着工业安全法规日趋严格和智能化监测技术的快速发展,该系统市场需求呈现加速增长态势。评价该市场的集中度,对于把握行业竞争格局、优化技术研发方向、制定精准的市场开发策略以及推动智能安全监测技术创新具有重要战略价值。1.数据采集:收集公司有害气体检测设备调试自动化系统在不同地区的销售数据,具体包括:时间、系统名称、区域、客户编号、销售额/万元、总销售额/万元。 2.数据处理:去除异常值和重复数据,确保数据的准确性和可靠性。将客户的销售额数据转换为市场份额(Si),即销售额占总销售额的比例。 3.具体计算过程和公式:市场份额计算:Si = 客户销售额 / 总销售额,市场集中度指数(CR)计算:CR = ∑(Si)^2,其中Si代表第i个客户的市场份额(销售额占总销售额的比例)。 4.数据分类分级应用:根据CR指数的大小,CR指数的取值范围为0到1,将市场集中度分为高集中度(0.7≤CR≤1)、中集中度(0.4≤CR<0.7)和低集中度(0≤CR<0.4)。
浙江省数据知识产权登记平台 收录
MeSH
MeSH(医学主题词表)是一个用于索引和检索生物医学文献的标准化词汇表。它包含了大量的医学术语和概念,用于描述医学文献中的主题和内容。MeSH数据集包括主题词、副主题词、树状结构、历史记录等信息,广泛应用于医学文献的分类和检索。
www.nlm.nih.gov 收录