Movies Dataset|电影行业数据集|数据分析数据集
收藏Movies Dataset Project - SQL Queries
数据集概述
- 包含内容: 30个MySQL查询,用于探索和分析电影数据集。
- 数据集信息: 包含电影名称、评分、类型、年份、发行日期、IMDb评分、投票数、导演、编剧、主演、国家、预算、总收入、制作公司和电影时长。
数据集列
name
: 电影名称rating
: 电影评分genre
: 电影类型year
: 发行年份released
: 发行日期score
: IMDb评分votes
: 投票数director
: 导演writer
: 编剧star
: 主演country
: 制作国家budget
: 电影预算gross
: 总收入company
: 制作公司runtime
: 电影时长(分钟)
查询分类
初级问题
- 查询所有列
- 按年份筛选:查找1985年发行的所有电影
- 按类型筛选:查找所有“动作”电影
- 统计电影数量
- 按评分排序:按评分降序排列电影
- 选择特定列:仅检索电影名称和评分
- 按评分筛选:查找评分大于8.0的所有电影
- 查找唯一类型:列出数据集中所有唯一的类型
- 按国家统计电影数量
- 按预算筛选:查找预算低于100万美元的所有电影
中级问题
- 最高收入电影:查找总收入最高的电影
- 按类型计算平均评分
- 发行年份在2000年之后的电影
- 按评分排序:按评分升序排列电影
- 按导演筛选:查找“克里斯托弗·诺兰”导演的所有电影
- 按年份统计电影数量
- 前5部评分最高的电影
- 投票数高于平均值的电影
- 按时长筛选:查找时长在90到120分钟之间的所有电影
- 1月份发行的电影
高级问题
- 每个类型的最高评分
- 按国家计算平均总收入
- 预算大于总收入的电影
- 按导演统计电影数量
- 复杂筛选:查找评分大于8.0且预算低于500万美元的电影
- 拥有最多电影的编剧
- 按年份和类型统计电影数量
- 主演为“莱昂纳多·迪卡普里奥”的电影
- 按总收入排名前三的制作公司
- 评分和投票数高于平均值的电影
使用方法
- 克隆仓库
- 设置MySQL
- 运行查询
学习成果
通过本项目,您将学习如何:
- 使用
SELECT
语句检索数据 - 使用
WHERE
、BETWEEN
和IN
子句筛选数据 - 使用聚合函数如
COUNT()
、SUM()
、AVG()
、MIN()
和MAX()
- 使用
ORDER BY
排序数据 - 使用
GROUP BY
和HAVING
分组和聚合数据 - 编写包含多个条件、连接和嵌套查询的复杂查询
许可证
本项目采用MIT许可证。

MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
鸭绿江流域与水系 – 世界地理数据大百科辞条
鸭绿江流域是指鸭绿江干流和支流汇水区,地理位置为39°43′57″N-42°17′28″N,123°35′59″E-128°45′50″E。与其接壤的流域分别是辽河流域(东)、松花江流域(北)、图们江流域(北)、大同江流域(西南)等。鸭绿江流域界线在中国境内从长白山天池火山口的南壁起始,向西南经长白山脉、转向西南至千山山脉的北部,再折向南入海;在朝鲜境内,鸭绿江流域从长白山天池南坡启始向东南经过摩天岭山脉,在头流山(2309 m)转向西南方向的赴战岭山脉,在英雄里附近转向西,经狼林山(2184 m)、广城、松源,转向西南方向的狄逾岭山脉,接江南山脉的南部后至鸭绿江河口。鸭绿江流域面积65215.49 km²,其中,中国境内面积32799.22 km²,朝鲜境内面积32416.27 km²。鸭绿江是中(国)朝(鲜)界河,它起源于长白山天池火山口的南壁,向南经惠山(朝)、折向西经临江(中)、再转向西南直向丹东(中)、新义州(朝),最后在东港(中)和多狮里(朝)附近注入黄海的西朝鲜湾。鸭绿江干流长844.98 km,有几条比较大的支流汇入,包括在朝鲜境内的虛川江、長津江、厚州川、慈城江、禿魯江、忠满江和三桥川;在中国境内的浑江、蒲石河、瑗河等。鸭绿江干流沿中朝国界线自东北向西南流经吉林省的长白朝鲜族自治县、临江市、集安市;辽宁省的桓仁满族自治县、宽甸满族自治县、丹东市和东港市;朝鲜的两江道、慈江道和平安北道。鸭绿江流域地处暖温带湿润季风气候区。年降水量800-1200 mm。流域内多山,最高海拔2745 m,河道比降比较大,达到0.0032,其中在中段可达到0.01。丰富的降水补给和较大的河床比降,使得鸭绿江流域成为亚洲单位面积水资源和水利资源最丰富的流域之一。近80年来,流域内先后建造了水丰水库(中、朝)、渭源水库(中、朝)、铁甲水库(中)、太平哨水库(中)、桓仁水库(中)、回龙山水库(中)、满丰湖水库(朝)、版平里水库(朝)、时中湖水库(朝)、狼林湖水库(朝)、长津湖水库(朝)、赴战湖水库(朝)、丰西湖水库等(朝)。数据文件包括鸭绿江干流、鸭绿江水系和鸭绿江流域地理信息系统数据文件组成。数据集以.kmz 和.shp格式存储,数据量43.8 MB(压缩为20.1 MB)。
国家对地观测科学数据中心 收录
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
FishBase Species List
FishBase Species List 是一个包含全球鱼类物种信息的全面数据库。该数据集提供了关于鱼类物种的详细信息,包括物种名称、分类学信息、分布区域、生态习性、繁殖行为、食性等。此外,数据集还包括了每个物种的图片和参考文献,以便用户进行深入研究。
www.fishbase.se 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录