佛山市南海区2013年慈善阳光信息平台资讯管理咨询表信息|慈善管理数据集|信息分析数据集
收藏PASCAL VOC 2007
这个挑战的目标是从现实场景中的许多视觉对象类别中识别对象(即不是预先分割的对象)。它基本上是一个监督学习问题,因为它提供了一组标记图像的训练集。已选择的 20 个对象类别是: 人:人 动物:鸟、猫、牛、狗、马、羊 交通工具:飞机、自行车、船、公共汽车、汽车、摩托车、火车 室内:瓶子、椅子、餐桌、盆栽、沙发、电视/显示器 将有两个主要比赛和两个较小规模的“品酒师”比赛。内容:提供的训练数据由一组图像组成;每个图像都有一个注释文件,为图像中存在的 20 个类别之一中的每个对象提供一个边界框和对象类别标签。请注意,来自多个类的多个对象可能出现在同一图像中。
OpenDataLab 收录
AFD-dataset
我们创建了迄今为止最大的亚洲人脸数据集,包含360,000张人脸图片,涉及2019个人。相比之下,第二大的亚洲人脸数据集CASIA-FaceV5仅包括2500张图片和500个人。
github 收录
OECD Statistics
OECD Statistics 数据集包含了经济合作与发展组织(OECD)发布的各种统计数据,涵盖了经济、社会、环境、教育、科技等多个领域。数据集提供了详细的指标和时间序列数据,帮助研究人员和政策制定者分析和理解全球经济和社会发展趋势。
stats.oecd.org 收录
HaluMem-Medium, HaluMem-Long
HaluMem数据集旨在评估记忆系统中存在的幻觉现象。该数据集由MemTensor (上海) 科技和哈尔滨工程大学联合构建,包含约15,000个记忆点,以及超过3,400个评估查询。每个用户的平均对话轮数为1,000轮以上,最长对话长度可达百万级Tokens,能够全面评估不同上下文规模和任务复杂度下的幻觉行为。
arXiv 收录
GenshinVoice
GenshinVoice是一个包含原神游戏中所有语音文件及其对应文字文本的数据集。数据集直接从游戏中提取,包含多种语言版本,用于学习和研究目的。
github 收录
