asmr-archive-data-02|ASMR数据集|数据存档数据集
收藏数据集概述
数据集名称: ASMR Archive Dataset
数据集许可证: AGPL-3.0
语言: 日语 (ja)
标签: not-for-all-audiences
数据集大小: n>1T
是否支持在线查看: 否 (viewer: false)
数据集用途: 教育和研究
数据集内容: 该数据集包含ASMR作品的存档。
重要提示:
- 数据集大小超过64 TiB。
- 不建议使用
git clone
,因为它会消耗双倍的磁盘空间。推荐使用Hugging Face CLI或Python库选择和下载文件子集。
数据集组成部分:

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
中国逐日格点降水数据集V2(1960–2024,0.1°)
CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。
国家青藏高原科学数据中心 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
有害气体检测设备调试自动化系统市场集中度评价数据
有害气体检测设备调试自动化系统作为保障工业安全生产、预防重大事故的核心技术装备,在石油化工、矿山开采、市政管网和环保监测等领域发挥着不可替代的作用。特别是在应对有毒有害气体泄漏、爆炸极限预警等高风险场景时,其智能化调试、多参数协同分析的特性,不仅能显著提升检测精度和响应速度,还能通过预防性维护大幅降低安全事故发生率。随着工业安全法规日趋严格和智能化监测技术的快速发展,该系统市场需求呈现加速增长态势。评价该市场的集中度,对于把握行业竞争格局、优化技术研发方向、制定精准的市场开发策略以及推动智能安全监测技术创新具有重要战略价值。1.数据采集:收集公司有害气体检测设备调试自动化系统在不同地区的销售数据,具体包括:时间、系统名称、区域、客户编号、销售额/万元、总销售额/万元。 2.数据处理:去除异常值和重复数据,确保数据的准确性和可靠性。将客户的销售额数据转换为市场份额(Si),即销售额占总销售额的比例。 3.具体计算过程和公式:市场份额计算:Si = 客户销售额 / 总销售额,市场集中度指数(CR)计算:CR = ∑(Si)^2,其中Si代表第i个客户的市场份额(销售额占总销售额的比例)。 4.数据分类分级应用:根据CR指数的大小,CR指数的取值范围为0到1,将市场集中度分为高集中度(0.7≤CR≤1)、中集中度(0.4≤CR<0.7)和低集中度(0≤CR<0.4)。
浙江省数据知识产权登记平台 收录