mikewang/AwA2|零样本学习数据集|图像分类数据集
收藏数据集卡片 for Animals with Attributes v2 (AwA2)
数据集描述
主页: https://cvml.ista.ac.at/AwA2/
重要注意事项
- 此HF数据集下载数据集(https://cvml.ista.ac.at/AwA2/AwA2-data.zip),并加载带有类级别注释的图像实例。
- 此HF数据集中的“训练”分割包含所有图像。对于原始提出的分割和提出的分割版本2.0,请参阅此处。
- 许可证文件也包含在下载的数据集中(https://cvml.ista.ac.at/AwA2/AwA2-data.zip)
论文引用:
@article{xian2018zero, title={Zero-shot learning—a comprehensive evaluation of the good, the bad and the ugly}, author={Xian, Yongqin and Lampert, Christoph H and Schiele, Bernt and Akata, Zeynep}, journal={IEEE transactions on pattern analysis and machine intelligence}, volume={41}, number={9}, pages={2251--2265}, year={2018}, publisher={IEEE} }
数据集摘要
此数据集提供了一个平台来基准测试迁移学习算法,特别是基于属性的分类和零样本学习[1]。它可以作为原始Animals with Attributes (AwA)数据集[2,3]的即插即用替代品,因为它具有相同的类结构和几乎相同的特征。 它包含50个动物类别的37322张图像,每张图像都有预提取的特征表示。这些类别与Osherson的经典类/属性矩阵[3,4]对齐,从而为每个类别提供85个数值属性值。通过共享属性,可以在不同类别之间传递信息。 图像数据收集自公共资源,如Flickr,于2016年。在收集过程中,我们确保仅包括许可用于自由使用和重新分发的图像,请参阅存档中的个别许可证文件。如果数据集中包含您拥有版权且未自由许可的图像,请与我们联系,以便我们将其从集合中删除。
参考文献
[1] Y. Xian, C. H. Lampert, B. Schiele, Z. Akata. "Zero-Shot Learning - A Comprehensive Evaluation of the Good, the Bad and the Ugly", IEEE Transactions on Pattern Analysis and Machine Intelligence (T-PAMI) 40(8), 2018. (arXiv:1707.00600 [cs.CV]) [2] C. H. Lampert, H. Nickisch, and S. Harmeling. "Learning To Detect Unseen Object Classes by Between-Class Attribute Transfer". In CVPR, 2009 [3] C. H. Lampert, H. Nickisch, and S. Harmeling. "Attribute-Based Classification for Zero-Shot Visual Object Categorization". IEEE T-PAMI, 2013 [4] D. N. Osherson, J. Stern, O. Wilkie, M. Stob, and E. E. Smith. "Default probability". Cognitive Science, 15(2), 1991. [5] C. Kemp, J. B. Tenenbaum, T. L. Griffiths, T. Yamada, and N. Ueda. "Learning systems of concepts with an infinite relational model". In AAAI, 2006.

GME Data
关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。
github 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
FSDD
FSDD(Free Spoken Digit Dataset)是一个开源的语音数据集,包含由不同说话者朗读的数字0到9的音频文件。该数据集旨在用于语音识别和机器学习算法的训练和测试。
github.com 收录
光伏电站发电量预估数据
1、准确预测一个地区分布式光伏场站的整体输出功率,可以提高电网的稳定性,增加电网消纳光电能量的能力,在降低能源消耗成本的同时促进低碳能源发展,实现动态供需状态预测的方法,为绿色电力源网荷储的应用落地提供支持。 2、准确预估光伏电站发电量,可以自动发现一些有故障的设备或者低效电站,提升发电效能。1、逆变器及电站数据采集,将逆变器中计算累计发电量数据,告警数据同步到Maxcompute大数据平台 2、天气数据采集, 通过API获取ERA5气象数据包括光照辐射、云量、温度、湿度等 3、数据特征构建, 在大数据处理平台进行数据预处理,用累计发电量矫正小时平均发电功率,剔除异常数据、归一化。告警次数等指标计算 4、异常数据处理, 天气、设备数据根据经纬度信息进行融合, 并对融合后的数据进行二次预处理操作,剔除辐照度和发电异常的一些数据 5、算法模型训练,基于XGBoost算法模型对历史数据进行训练, 生成训练集并保存至OSS 6、算法模型预测,基于XGBoost算法模型接入OSS训练集对增量数据进行预测, 并评估预测准确率等效果数据,其中误差率=(发电量-预估发电量)/发电量,当误差率低于一定阈值时,该数据预测为准确。预测准确率=预测准确数量/预测数据总量。
浙江省数据知识产权登记平台 收录