WISDM Actitracker Dataset|行为识别数据集|传感器数据数据集
收藏
- WISDM Actitracker Dataset首次发表,由West Chester University的WISDM实验室发布,旨在提供一个用于行为识别的标准数据集。
- 该数据集首次应用于行为识别领域的研究,特别是在移动设备上的用户行为分析。
- WISDM Actitracker Dataset被广泛应用于机器学习和数据挖掘领域的研究,成为行为识别研究的重要基准数据集之一。
- 数据集的扩展版本发布,增加了更多的行为类别和样本数量,进一步提升了其在行为识别研究中的应用价值。
- WISDM Actitracker Dataset被多个国际会议和期刊引用,成为行为识别领域的重要参考数据集。
- 数据集的最新版本发布,优化了数据质量和标注准确性,继续支持行为识别和健康监测等领域的研究。
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
MultiTalk
MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。
arXiv 收录
CosyVoice 2
CosyVoice 2是由阿里巴巴集团开发的多语言语音合成数据集,旨在通过大规模多语言数据集训练,实现高质量的流式语音合成。数据集通过有限标量量化技术改进语音令牌的利用率,并结合预训练的大型语言模型作为骨干,支持流式和非流式合成。数据集的创建过程包括文本令牌化、监督语义语音令牌化、统一文本-语音语言模型和块感知流匹配模型等步骤。该数据集主要应用于语音合成领域,旨在解决高延迟和低自然度的问题,提供接近人类水平的语音合成质量。
arXiv 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Arizona Cities by Population
A dataset listing Arizona cities by population for 2024.
www.arizona-demographics.com 收录