有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
singer.csv
:包含所有华语男歌手、女歌手、组合的{id,姓名},约5700行。song.csv
:包含歌曲信息,格式为歌手id::歌曲名::歌手名::热度
,约260000行。MusicList_2024-05-28T02-23-05.csv
:包含歌单信息,格式为AmountOfPlay,AuthorID,Collection,Comment,CreationDate,Forwarding,Labels,NumberOfSongs,SongListName,SongsListID,Url
,约600行。songlist.csv
:处理后的歌单信息,格式为歌单名##标签##歌单id##收藏量
。songlist2songs.txt
:包含歌单及其对应歌曲信息,格式为歌单信息后跟歌曲信息,用
分隔。getAllSinger.py
文件,将结果写入singer.csv
。getSingerHotSong.py
文件,将结果写入song.csv
。wyyMusic
文件夹中的脚本,将结果写入MusicList_2024-05-28T02-23-05.csv
,并进一步处理为songlist.csv
。Songlist2Songs.py
文件,将结果写入songlist2songs.txt
。Music_Recommend_System.ipynb
文件,可以查找与一个歌单最接近的10个歌单,以及根据歌曲推荐的10首歌。Music_Recommend_UI.py
文件,提供图形用户界面。LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
LogiQA
LogiQA 包含 8,678 个 QA 实例,涵盖多种类型的演绎推理。结果表明,最先进的神经模型的性能远远低于人类天花板。该数据集还可以作为在深度学习 NLP 设置下重新研究逻辑 AI 的基准。
OpenDataLab 收录
China Groundgroundwater Monitoring Network
该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。
www.ngac.org.cn 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录