Dry Bean Dataset|干豆分类数据集|机器学习数据集
收藏数据集概述
数据集名称
Dry Bean Dataset
数据集来源
UCI Machine Learning Repository
数据集详情
- 实例数量: 13611
- 属性数量: 17
数据集用途
用于支持向量机(SVM)参数优化项目,主要用于分类任务。
参数优化详情
- 优化参数:
- Nu (C): 控制模型中使用的支持向量数量。
- Kernel: 指定SVM算法中使用的核函数。
- Epsilon (Gamma): 确定SVM算法允许的误差边际。
优化结果
- 最高准确率: 0.61(样本1)
- 优化参数配置:
- Kernel: Poly
- Nu: 6.72
- Epsilon: 6.02
结论
通过参数优化,SVM模型在分类任务中的性能得到提升,训练和交叉验证曲线间的差距最小化,表明模型训练良好。

Amazon电影评论数据集
该数据集包含从1997年8月至2012年10月期间,Amazon用户对253,059种产品的7,911,684条评论。数据集被添加了真实标签,这些标签是通过爬取/抓取Amazon.com获得的,用于分类产品。
github 收录
LUNA16
LUNA16(肺结节分析)数据集是用于肺分割的数据集。它由 1,186 个肺结节组成,在 888 次 CT 扫描中进行了注释。
OpenDataLab 收录
alpacaGPT4_llama8b-v120-jb-seed2-alpaca_512_ngt0.7_tp0.9
该数据集包含了用户和助手之间的对话,具有用户和助手发言的文本特征,以及一个索引级别特征。数据集分为训练集,共有52001条对话记录。
huggingface 收录
电商直播间互动率数据评价检测数据
1.了解观众兴趣和需求:通过分析互动率数据,商家可以了解观众对直播内容和商品的兴趣和需求,从而调整直播策略和商品陈列方式,提高观众的购买转化率。 2.评估主播能力和带货效果:互动率数据可以用来评估主播的能力和带货效果。如果一个主播能够有效地引导观众互动,可能说明该主播的能力较强。商家可以根据互动率数据来评估不同主播的能力和带货效果,从而更好地选择合作对象。 3.检测数据真实性:互动率数据可以反映观众在直播间中的真实活跃度和参与度,帮助商家检测数据的真实性。如果互动率数据与实际数据存在较大偏差,可能说明数据存在异常或问题,商家需要进一步调查和处理,以保障市场的公平和公正。 4.发现潜在问题:通过分析互动率数据,商家可以发现直播间中可能存在的问题。 5.优化售后服务:如果一个直播间的互动率很低,可能说明观众在购买商品后遇到了一些问题,商家需要优化售后服务,提高客户满意度和忠诚度。数据处理:将收集到的各电商直播间互动率数据进行归集,将电商直播间互动率数据计算数值与电商直播间互动率数据评定标准值对比判定该电商直播间互动率是否达标,(互动人数/进房人数*100%=互动率),互动率标准数值的确定方式:结合该直播类型、直播类型和观众画像等因素综合考虑得出互动率的标准数值,为50%,当计算数值大于标准数值时互动率达标,当计算数值小于标准数值时互动率不达标
浙江省数据知识产权登记平台 收录
中国近海台风路径集合数据集(1945-2024)
1945-2024年度,中国近海台风路径数据集,包含每个台风的真实路径信息、台风强度、气压、中心风速、移动速度、移动方向。 数据源为获取温州台风网(http://www.wztf121.com/)的真实观测路径数据,经过处理整合后形成文件,如使用csv文件需使用文本编辑器打开浏览,否则会出现乱码,如要使用excel查看数据,请使用xlsx的格式。
国家海洋科学数据中心 收录