five

asmr-archive-data-02|ASMR数据集|数据存档数据集

收藏
huggingface2025-02-10 更新2025-02-10 收录
ASMR
数据存档
下载链接:
https://huggingface.co/datasets/DeliberatorArchiver/asmr-archive-data-02
下载链接
链接失效反馈
资源简介:
ASMR存档数据集是一个包含ASMR作品的存档,用于教育和研究目的。该数据集规模巨大,超过64 TiB,并且包含的内容可能不适合所有受众。
创建时间:
2025-02-01
原始信息汇总

数据集概述

数据集名称: ASMR Archive Dataset

数据集许可证: AGPL-3.0

语言: 日语 (ja)

标签: not-for-all-audiences

数据集大小: n>1T

是否支持在线查看: 否 (viewer: false)

数据集用途: 教育和研究

数据集内容: 该数据集包含ASMR作品的存档。

重要提示:

  • 数据集大小超过64 TiB。
  • 不建议使用git clone,因为它会消耗双倍的磁盘空间。推荐使用Hugging Face CLIPython库选择和下载文件子集。

数据集组成部分:

AI搜集汇总
数据集介绍
main_image_url
构建方式
ASMR Archive Dataset的构建主要依托于网络资源的收集与整合,其数据实体分布存储于多个代码仓库之中,实现了对ASMR作品的集中化存档。该数据集的构建以教育及研究目的为宗旨,严格筛选并收录了大量的ASMR相关文件。
特点
该数据集的特点在于其庞大的数据规模,高达64TiB的存储容量体现了其丰富的内容涵盖。此外,数据集遵循AGPL-3.0协议,具有一定的版权限制,同时标注为不适宜所有观众,意味着其内容具有一定的选择性。利用Git LFS的直接克隆可能会因磁盘空间消耗巨大而受到影响,因此推荐使用Hugging Face CLI或Python库进行文件的选取与下载。
使用方法
在使用ASMR Archive Dataset时,用户需遵循特定的下载方式,以避免不必要的资源浪费。推荐使用Hugging Face CLI或Python库进行按需下载,以确保只获取所需的数据子集。此外,用户在使用数据集时需自行承担风险,且仅限于教育及研究目的。
背景与挑战
背景概述
asmr-archive-data-02数据集,全称为ASMR Archive Dataset,是一份旨在教育及研究用途的ASMR(Autonomous Sensory Meridian Response,自发性感觉经络反应)作品档案集合。该数据集由DeliberatorArchiver维护,包含了超过64 TiB的文件,体现了ASMR领域内研究资料的丰富性与多样性。自发布以来,该数据集在学术界和爱好者群体中均产生了广泛的影响,为ASMR现象的研究提供了宝贵的第一手资料。
当前挑战
数据集的构建与维护面临着诸多挑战。首先,由于ASMR作品的特性,该数据集需处理版权和适宜性等问题,故其使用声明中明确指出仅用于教育和研究目的,且使用者需自负风险。其次,数据集规模巨大,导致存储与传输面临较高成本和技术难题,如使用Git LFS进行克隆会消耗双倍磁盘空间,因此需要特定的工具和库来进行子集的选取与下载。此外,文件实体的分散存储也增加了数据集管理和访问的复杂性。
常用场景
经典使用场景
在声音研究领域,asmr-archive-data-02数据集作为ASMR档案存储的重要组成部分,其经典使用场景主要在于为学术研究者提供丰富的声音样本,用于分析ASMR音频的特性,从而探究ASMR对人类情绪和生理反应的影响。
实际应用
在实用层面,asmr-archive-data-02数据集可用于开发针对压力缓解、睡眠辅助的应用程序,有助于提升用户的生活质量,同时也可作为声音内容创作的素材库,推动相关产业的发展。
衍生相关工作
基于该数据集,学术界已衍生出多项研究工作,如ASMR音频对睡眠质量的影响评估、ASMR音频特性与听众偏好之间的关系分析等,这些研究进一步拓宽了ASMR领域的研究视野。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

Yahoo Finance

Dataset About finance related to stock market

kaggle 收录

中国逐日格点降水数据集V2(1960–2024,0.1°)

CHM_PRE V2数据集是一套高精度的中国大陆逐日格点降水数据集。该数据集基于1960年至今共3476个观测站的长期日降水观测数据,并纳入11个降水相关变量,用于表征降水的相关性。数据集采用改进的反距离加权方法,并结合基于机器学习的LGBM算法构建。CHM_PRE V2与现有的格点降水数据集(包括CHM_PRE V1、GSMaP、IMERG、PERSIANN-CDR和GLDAS)表现出良好的时空一致性。数据集基于63,397个高密度自动雨量站2015–2019年的观测数据进行验证,发现该数据集显著提高了降水测量精度,降低了降水事件的高估,为水文建模和气候评估提供了可靠的基础。CHM_PRE V2 数据集提供分辨率为0.1°的逐日降水数据,覆盖整个中国大陆(18°N–54°N,72°E–136°E)。该数据集涵盖1960–2024年,并将每年持续更新。日值数据以NetCDF格式提供,为了方便用户,我们还提供NetCDF和GeoTIFF格式的年度和月度总降水数据。

国家青藏高原科学数据中心 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录

有害气体检测设备调试自动化系统市场集中度评价数据

有害气体检测设备调试自动化系统作为保障工业安全生产、预防重大事故的核心技术装备,在石油化工、矿山开采、市政管网和环保监测等领域发挥着不可替代的作用。特别是在应对有毒有害气体泄漏、爆炸极限预警等高风险场景时,其智能化调试、多参数协同分析的特性,不仅能显著提升检测精度和响应速度,还能通过预防性维护大幅降低安全事故发生率。随着工业安全法规日趋严格和智能化监测技术的快速发展,该系统市场需求呈现加速增长态势。评价该市场的集中度,对于把握行业竞争格局、优化技术研发方向、制定精准的市场开发策略以及推动智能安全监测技术创新具有重要战略价值。1.数据采集:收集公司有害气体检测设备调试自动化系统在不同地区的销售数据,具体包括:时间、系统名称、区域、客户编号、销售额/万元、总销售额/万元。 2.数据处理:去除异常值和重复数据,确保数据的准确性和可靠性。将客户的销售额数据转换为市场份额(Si),即销售额占总销售额的比例。 3.具体计算过程和公式:市场份额计算:Si = 客户销售额 / 总销售额,市场集中度指数(CR)计算:CR = ∑(Si)^2,其中Si代表第i个客户的市场份额(销售额占总销售额的比例)。 4.数据分类分级应用:根据CR指数的大小,CR指数的取值范围为0到1,将市场集中度分为高集中度(0.7≤CR≤1)、中集中度(0.4≤CR<0.7)和低集中度(0≤CR<0.4)。

浙江省数据知识产权登记平台 收录