Kpop-lyric-datasets|韩国流行音乐数据集|文本挖掘数据集
收藏数据集概述
数据集名称
- Kpop-lyric-datasets
数据集内容
- 包含25696首K-pop歌曲的JSON格式数据,数据来源于Melons Monthly Chart Ranking 100 (2000 ~ 2023 Oct.)。
数据集使用许可
- 可用于研究目的,商业使用需与歌词作者、艺术家、作曲家等协商。
数据集结构
数据文件路径
melonmonthly-chartmelon-<year>melon-<year>-<month>melon-monthly_<year>-<month>_<chart rank>.json
数据字段详情
- info: 包含歌曲的元数据,如年份、月份、排名、类型和来源网站。
- song_id: 歌曲在Melon数据库中的ID。
- song_name: 歌曲名称。
- album: 专辑名称。
- release_date: 歌曲发布日期。
- artist: 艺术家名称。
- genre: 歌曲类型。
- lyric_writer: 歌词作者。
- composer: 作曲家。
- arranger: 编曲者。
- lyrics: 歌词内容,包括行数和具体歌词。
数据集使用方法
获取数据
- 获取2023年数据: 使用
data_parser.get_dict(2023)
函数将数据转换为字典。 - 获取2010至2022年数据: 使用
data_parser.get_df(2010, 2022)
函数将数据转换为Pandas DataFrame。
数据集克隆
- 通过
git clone https://github.com/EX3exp/Kpop-lyric-datasets.git
命令克隆数据集到本地工作区。

Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
UAV123
从低空无人机捕获的视频与流行的跟踪数据集 (如OTB50,OTB100,VOT2014,VOT2015,TC128和ALOV300) 中的视频本质上不同。因此,我们提出了一个新的数据集 (UAV123),其序列来自空中视点,其子集用于长期空中跟踪 (UAV20L)。我们新的UAV123数据集包含总共123个视频序列和超过110K帧,使其成为仅次于ALOV300的第二大对象跟踪数据集。所有序列都用直立的边界框完全注释。数据集可以很容易地与视觉跟踪器基准集成。它包括无人机数据集的所有边界框和属性注释。还请使用包含序列和跟踪器配置的修改后的文件 “configSeqs.m” 和 “configTrackers.m” 下载修改后的跟踪器基准。另外,请注意,文件 “perfPlot.m” 已根据本文中描述的属性进行了修改以进行评估。
OpenDataLab 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录