Beer_Dataset|啤酒品质分析数据集|消费者偏好研究数据集
收藏Beer_Dataset 概述
数据集结构
数据集包含在 train.csv
文件中,具有以下列:
- index:评论的标识符。
- beer/ABV:啤酒的酒精含量(按体积计算)。
- beer/beerId:啤酒的唯一ID。
- beer/brewerId:酿酒厂的唯一ID。
- beer/name:啤酒的名称。
- beer/style:啤酒的风格。
- review/appearance:啤酒外观的评分(1.0至5.0)。
- review/aroma:啤酒香气的评分(1.0至5.0)。
- review/overall:啤酒总体评分(1.0至5.0)。
- review/palate:啤酒口感的评分(1.0至5.0)。
- review/taste:啤酒味道的评分(1.0至5.0)。
- review/text:评论的文本内容。
- review/timeStruct:提交评论的时间信息(字典格式)。
- review/timeUnix:提交评论的时间(Unix时间格式)。
- user/ageInSeconds:用户的年龄(以秒计)。
- user/birthdayRaw:用户的出生日期(原始格式)。
- user/birthdayUnix:用户的出生日期(Unix时间格式)。
- user/gender:用户的性别(如果已指定)。
- user/profileName:用户的个人资料名称。
数据集应用
数据集用于监督学习,通过比较随机森林和梯度提升算法,发现梯度提升算法效果最佳,但运行时间较随机森林长。

啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊
reereererreereererreereererreereererreereererreereererreereererreereererreereererreereererreereererreereerer
阿里云天池 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
Food-11
This is a dataset containing 16643 food images grouped in 11 major categories
kaggle 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
UCSD26/medical_dialog
MedDialog数据集包含中英文两种语言的医患对话数据。中文数据集包含110万条对话和400万条话语,数据来源于haodf.com。英文数据集包含26万条对话,数据来源于healthcaremagic.com和icliniq.com。数据集的结构包括原始数据和经过处理的数据,原始数据包含对话ID、URL、患者病情描述和对话内容,处理后的数据则包括描述和对话话语。数据集的主要任务是封闭领域的问答(Closed domain QA)。
hugging_face 收录