东莞市发展和改革局行政许可事项信息|行政许可数据集|政府管理数据集
收藏NEPSE Open Data
首个尼泊尔证券交易所(NEPSE)的开源金融数据集,旨在提高尼泊尔资本市场的透明度、学习和创新。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
TinyPerson
TinyPerson是远距离且具有大量背景的微小物体检测的基准。TinyPerson中的图像是从互联网上收集的。首先,从不同的网站收集高分辨率的视频。其次,每50帧对视频中的图像进行采样。然后删除具有一定重复 (同质性) 的图像,并且用手用边界框用72,651对象注释所得图像。
OpenDataLab 收录
medical_speech_corpus
该数据集主要用于处理与语音和文本相关的任务。数据集包含四个主要特征:'term'(术语)、'text'(文本)、'voice'(语音)和'audio'(音频),其中音频的采样率为16000。数据集分为训练集和测试集,训练集包含8个样本,测试集包含2个样本。数据集的总下载大小为2814289字节,总数据集大小为1443699.0字节。
huggingface 收录
SENTIBENCH
SENTIBENCH是一个综合性的情感分析基准,由哈尔滨工业大学(深圳)的研究团队开发。该数据集包含3个典型类别:基本情感分析、多方面情感分析和细粒度情感分析,覆盖了12个代表性任务及其对应的数据集。它旨在系统地评估LLM在情感分析方面的能力,涵盖从文档到句子级别的情感分类,以及更复杂的情感状态识别和细粒度情感元素分析等任务。
arXiv 收录