Kaggle Yelp Dataset|用户评论数据集|商家信息数据集
收藏
- Kaggle Yelp Dataset首次发布,包含来自Yelp的用户评论、商家信息、用户数据和社交网络数据,为数据科学社区提供了丰富的分析资源。
- 该数据集在Kaggle平台上广泛应用于各种数据科学竞赛,促进了自然语言处理和机器学习技术在商业评论分析中的应用。
- 研究者开始利用Kaggle Yelp Dataset进行情感分析和推荐系统研究,推动了相关领域的学术进展。
- 数据集的更新版本发布,增加了更多用户和商家的详细信息,进一步丰富了数据内容。
- Kaggle Yelp Dataset被广泛应用于教育和培训,成为数据科学课程中的经典案例。
- 随着数据科学技术的进步,该数据集在深度学习和人工智能领域的应用逐渐增多,推动了相关算法的发展。
- Kaggle Yelp Dataset继续作为重要的数据资源,支持了多个跨学科研究项目,涵盖了从商业分析到社会网络研究的多个领域。
UCI Machine Learning Repository
UCI机器学习库是一个包含数据库、领域理论和数据生成器的集合,这些被机器学习社区用于机器学习算法的实证分析。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录