汕头市潮阳区烟草专卖局政务事项最新办理项基本信息|政务管理数据集|数据规范数据集
收藏MNBVC
MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。
github 收录
DIPSEER: A Dataset for In-Person Student Emotion and Engagement Recognition in the Wild
DIPSEER是一个用于识别学生情绪和参与度的数据集,包含图像、标签和传感器数据。
github 收录
XS-Video
XS-Video数据集是由中国科学院自动化研究所MAIS实验室提出的一个大规模现实世界短视频传播数据集。该数据集收集了来自中国五大平台(抖音、快手、西瓜视频、今日头条、哔哩哔哩)的117720个短视频,包含381926个样本和535个话题,覆盖了从发布后的互动信息,如观看、点赞、分享、收藏、粉丝和评论等。数据集通过跨平台指标对齐方法,对视频的长期传播影响力进行评分,分为0到9级,旨在为短视频传播研究提供全面的互动信息和内容特征。
arXiv 收录
World Development Indicators (WDI)
世界发展指标(World Development Indicators, WDI)是由世界银行发布的一个综合数据集,涵盖了全球200多个国家和地区的经济、社会和环境指标。数据集包括人口统计、教育、健康、经济、环境等多个领域的指标,旨在提供全球发展状况的全面视图。
databank.worldbank.org 收录
TILDA 400
Textile Texture Database (TILDA) for defect detection
kaggle 收录
