有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
data/original
目录下,包含不同格式的数据,存在读取复杂性。etl_eda
目录),原始数据被清洗并组织成3个有序文件,存储于data/limpio/
目录。/data
: 包含项目中使用的数据,包括原始数据、清洗后的数据及为API端点优化的数据。/etl_eda
: 包含进行ETL和EDA的Jupyter Notebook文件。/images
: 包含README文件中使用的图片。main.py
: 使用FastAPI框架创建API的主要代码文件。requirements.txt
: 项目依赖文件。网易云音乐数据集
该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。
github 收录
UAVDT
UAVDT是一个用于目标检测任务的数据集。
github 收录
Eurovision Song Contest Dataset
Eurovision Song Contest数据集是一个免费提供的数据集,包含1735首参赛歌曲的音频特征、元数据、比赛排名和投票数据,这些歌曲参与了从1956年到2023年的Eurovision Song Contest。
github 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录