Netflix Dataset|流媒体数据集|电影电视数据集
收藏Netflix-SQL-Project
描述
一个使用SQL分析Netflix数据集的项目,旨在探索电视剧和电影的各种属性,包括类型、评分、导演和国家等。项目的目标是提取关于内容流行度、发布趋势以及影响平台节目/电影选择的关键因素的见解。
数据集概述
该项目使用SQL分析Netflix数据集,包括平台上的电视剧和电影的各种属性。数据集包含以下信息:节目名称、导演、演员、原产国、发布年份、评分等。项目的目标是通过分析数据集来识别趋势、模式和与Netflix内容相关的关键见解。
数据集描述
数据集包含以下列:
- show_id: 每个节目或电影的唯一标识符。
- type: 内容类型(例如,电影或电视剧)。
- title: 节目或电影的标题。
- director: 内容的导演。
- cast: 主要演员/女演员。
- country: 节目/电影的制作国家。
- Date Added: 内容添加到Netflix的日期。
- release_year: 内容发布的年份。
- rating: 内容的评分。
- duration: 电影的时长或电视剧的集数。
- listed_in: 内容所属的类别(例如,喜剧、戏剧等)。
- description: 内容的简要描述。
目标
- 内容分布:了解电影和电视剧在不同国家、评分和类型中的分布。
- 趋势分析:识别内容发布年份、评分随时间变化的趋势以及Netflix添加内容的类型。
- 类型见解:探索基于“listed_in”列的最常见或最受欢迎的类型。
- 导演和演员分析:分析哪些导演和演员在数据集中频繁出现。
- 内容添加趋势:调查Netflix何时添加最多内容到其库中以及任何季节性模式。
使用的SQL技术
- 数据过滤:用于根据不同属性(如评分、类型或国家)过滤内容。
- 聚合:聚合数据以分析发布年份、评分或内容类型的趋势。
- 分组:按国家或类型等列对数据进行分组以分析内容分布。
- 排序和排名:按发布年份或评分对数据进行排序以识别顶级节目和电影。
预期见解
- 分析Netflix上最受欢迎的内容类型。
- 识别顶级评分电影和电视剧。
- 探索多年的发布趋势。
- 了解内容在不同国家之间的分布。
- 识别与最受欢迎内容相关的关键导演和演员。

中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
SKIPP’D
SKIPP’D数据集由斯坦福大学的环境评估与优化(EAO)组创建,旨在为基于图像的短期太阳能预测研究提供标准化基准。数据集包含2017至2019年三年的高质量控制下采样的天空图像和光伏发电数据,适合深度学习模型开发。此外,还提供了高分辨率、高频率的天空图像和光伏发电数据,以及相应的视频片段,以支持研究灵活性。数据集的应用领域包括天空图像分割、云类型分类和云运动预测,旨在解决太阳能预测中的短期波动问题。
arXiv 收录