UCI Bank Marketing Data Set|银行营销数据集|客户行为分析数据集
收藏
- UCI Bank Marketing Data Set首次发表,数据集包含了葡萄牙银行机构的直接营销活动数据,主要用于预测客户是否会订阅定期存款。
- 该数据集首次应用于学术研究,特别是在机器学习和数据挖掘领域,用于开发和验证预测模型。
- 随着数据集的普及,越来越多的研究论文开始引用和分析UCI Bank Marketing Data Set,探讨其在不同模型和算法中的表现。
- 数据集的应用范围扩展到商业智能和市场营销领域,企业开始利用该数据集进行客户行为分析和营销策略优化。
- UCI Bank Marketing Data Set成为数据科学教育中的经典案例,被广泛用于教学和培训,帮助学生理解实际业务问题与数据分析的结合。
- 1UCI Machine Learning Repository: Bank Marketing Data SetUniversity of California, Irvine · 2012年
- 2A Data-Driven Approach to Predict the Success of Bank TelemarketingSpringer · 2014年
- 3Predicting Term Deposit Subscription in Banks Using Machine Learning TechniquesIEEE · 2019年
- 4A Comparative Study of Machine Learning Algorithms for Bank MarketingElsevier · 2020年
- 5Enhancing Bank Telemarketing Success with Machine LearningTaylor & Francis · 2021年
中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
ChinaTravel
ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。
arXiv 收录
腾讯词向量(Tencent AI Lab Embedding Corpus for Chinese Words and Phrases)
这些语料库的最新版本提供了100维度和200维度的向量表示形式,也就是嵌入,适用于中文和英文。具体来说,有超过1200万个中文单词和短语以及650万个英语单词和短语,它们是在大规模高质量数据上进行预先培训的。这些向量捕获单词和短语的语义含义,可以广泛应用于许多下游任务 (例如,命名实体识别和文本分类) 以及进一步的研究中。
OpenDataLab 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录