Restaurants|餐饮业数据集|在线订餐数据集
收藏
- 首次发布Restaurants数据集,包含美国多个城市的餐厅信息,主要用于地理信息系统和位置服务研究。
- 数据集扩展至全球范围,涵盖更多国家和地区的餐厅数据,推动了跨文化餐饮服务研究。
- 引入用户评价和评论功能,增强了数据集的互动性和实用性,为消费者决策提供了重要参考。
- 数据集开始支持移动设备访问,适应了移动互联网的发展趋势,提升了用户体验。
- 引入大数据分析技术,对餐厅数据进行深度挖掘,为市场分析和商业决策提供了有力支持。
- 数据集进一步整合社交媒体数据,增强了餐厅品牌形象和消费者行为的分析能力。
- 1Yelp Dataset Challenge: RestaurantsYelp Inc. · 2015年
- 2Exploring the Yelp Dataset: A Comprehensive Analysis of Restaurants and User ReviewsUniversity of California, Berkeley · 2017年
- 3Predicting Restaurant Success on Yelp: A Machine Learning ApproachStanford University · 2018年
- 4Sentiment Analysis of Restaurant Reviews Using Yelp DatasetUniversity of Michigan · 2019年
- 5A Comparative Study of Machine Learning Models for Restaurant Review ClassificationMassachusetts Institute of Technology · 2020年
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
ALFA
ALFA数据集由卡内基梅隆大学机器人学院创建,专注于固定翼无人机的控制表面故障和异常检测。数据集包含47次自主飞行中的故障场景,涵盖了发动机、方向舵、副翼和升降舵等多种故障类型,总飞行时间为66分钟正常飞行和13分钟故障后飞行。数据集的创建涉及对飞行器的硬件和软件进行定制修改,以模拟各种故障情况。该数据集主要用于无人机故障检测和隔离(FDI)以及异常检测(AD)研究,旨在提高自主飞行操作的安全性。
arXiv 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录