Twitter15 and Twitter16|谣言检测数据集|社交媒体分析数据集
收藏
- Twitter15数据集首次发表,该数据集主要用于社交媒体中的谣言检测研究,包含了2015年Twitter上的谣言和非谣言帖子。
- Twitter16数据集发布,作为Twitter15的延续,该数据集包含了2016年Twitter上的谣言和非谣言帖子,进一步扩展了研究的时间范围和数据量。
- Twitter15和Twitter16数据集首次应用于多个谣言检测算法的研究中,显著提升了算法在社交媒体数据上的表现。
- 研究者开始利用Twitter15和Twitter16数据集进行跨年度的谣言传播模式分析,揭示了谣言在社交媒体上的动态变化。
- Twitter15和Twitter16数据集被广泛应用于多模态谣言检测研究,结合文本、图像和用户行为数据,提升了检测的准确性。
- 基于Twitter15和Twitter16数据集的研究成果被应用于实际的社交媒体监控系统中,帮助平台更好地管理和应对谣言传播。
- 1A Convolutional Neural Network for Rumor Event Classification, Location Clustering, and VisualizationUniversity of California, Santa Barbara · 2017年
- 2Rumor Detection on Twitter with Tree-structured Recursive Neural NetworksUniversity of Illinois at Urbana-Champaign · 2018年
- 3Exploiting Tri-Relationship for Fake News DetectionTsinghua University · 2019年
- 4A Survey on Fake News and Rumor Detection TechniquesUniversity of California, Davis · 2020年
- 5Deep Learning for Rumor Detection on TwitterUniversity of Technology Sydney · 2021年
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
UAVDT
UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。
arXiv 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
Tropicos
Tropicos是一个全球植物名称数据库,包含超过130万种植物的名称、分类信息、分布数据、图像和参考文献。该数据库由密苏里植物园维护,旨在为植物学家、生态学家和相关领域的研究人员提供全面的植物信息。
www.tropicos.org 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录