five

mstz/speeddating

收藏
Hugging Face2023-04-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mstz/speeddating
下载链接
链接失效反馈
官方服务:
资源简介:
Speed dating数据集来自OpenML,主要用于二分类任务,即判断两个人是否会约会。数据集的规模在1K到10K之间,包含多个特征,如性别、年龄、种族、兴趣等。

Speed dating数据集来自OpenML,主要用于二分类任务,即判断两个人是否会约会。数据集的规模在1K到10K之间,包含多个特征,如性别、年龄、种族、兴趣等。
提供机构:
mstz
原始信息汇总

数据集概述

  • 名称: Speed dating
  • 标签:
    • speeddating
    • tabular_classification
    • binary_classification
  • 美观名称: Speed dating
  • 大小分类: 1K<n<10K
  • 任务分类: tabular-classification
  • 配置: dating

配置与任务

配置 任务 描述
dating Binary classification Will the two date?

数据集特征

特征 类型
is_dater_male int8
dater_age int8
dated_age int8
age_difference int8
dater_race string
dated_race string
are_same_race int8
same_race_importance_for_dater float64
same_religion_importance_for_dater float64
attractiveness_importance_for_dated float64
sincerity_importance_for_dated float64
intelligence_importance_for_dated float64
humor_importance_for_dated float64
ambition_importance_for_dated float64
shared_interests_importance_for_dated float64
attractiveness_score_of_dater_from_dated float64
sincerity_score_of_dater_from_dated float64
intelligence_score_of_dater_from_dated float64
humor_score_of_dater_from_dated float64
ambition_score_of_dater_from_dated float64
shared_interests_score_of_dater_from_dated float64
attractiveness_importance_for_dater float64
sincerity_importance_for_dater float64
intelligence_importance_for_dater float64
humor_importance_for_dater float64
ambition_importance_for_dater float64
shared_interests_importance_for_dater float64
self_reported_attractiveness_of_dater float64
self_reported_sincerity_of_dater float64
self_reported_intelligence_of_dater float64
self_reported_humor_of_dater float64
self_reported_ambition_of_dater float64
reported_attractiveness_of_dated_from_dater float64
reported_sincerity_of_dated_from_dater float64
reported_intelligence_of_dated_from_dater float64
reported_humor_of_dated_from_dater float64
reported_ambition_of_dated_from_dater float64
reported_shared_interests_of_dated_from_dater float64
dater_interest_in_sports float64
dater_interest_in_tvsports float64
dater_interest_in_exercise float64
dater_interest_in_dining float64
dater_interest_in_museums float64
dater_interest_in_art float64
dater_interest_in_hiking float64
dater_interest_in_gaming float64
dater_interest_in_clubbing float64
dater_interest_in_reading float64
dater_interest_in_tv float64
dater_interest_in_theater float64
dater_interest_in_movies float64
dater_interest_in_concerts float64
dater_interest_in_music float64
dater_interest_in_shopping float64
dater_interest_in_yoga float64
interests_correlation float64
expected_satisfaction_of_dater float64
expected_number_of_likes_of_dater_from_20_people int8
expected_number_of_dates_for_dater int8
dater_liked_dated float64
probability_dated_wants_to_date float64
already_met_before int8
dater_wants_to_date int8
dated_wants_to_date int8
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集以速度约会为背景,采集了参与者的个人信息、兴趣爱好以及双方互相打分等数据,构建了一个包含多种特征属性的表格型数据集,旨在为二分类任务提供支持,即判断双方是否有继续约会的意愿。
特点
数据集涵盖了两千多对约会者的信息,包含性别、年龄、种族、宗教信仰、个人特质重要性评分、自我报告特质评分、对方特质评分、兴趣爱好等多个维度的信息。其特征类型丰富,既有数值型也有分类型,为研究人际交往中的匹配度提供了丰富的数据资源。
使用方法
使用该数据集时,可以通过Hugging Face的datasets库直接加载。加载后,用户将得到训练集和测试集,其中包含了所有的特征以及标签信息。用户可以根据具体的任务需求,对数据进行预处理和模型训练,进而评估模型在预测约会双方是否愿意继续交往方面的性能。
背景与挑战
背景概述
Speed dating数据集,源于社会心理学领域,旨在研究人际交往与配对行为。该数据集由Michael Steiner和同事们在21世纪初创建,依托于Speed Dating实验,通过收集参与者在约会中的行为和偏好数据,探究影响人际吸引与配对成功的因素。数据集涵盖了一系列个人特征、自我评价、对方评价以及配对结果等信息,为研究提供了宝贵的实证资料。Speed dating数据集的出现,为社会心理学、行为经济学等领域的研究提供了新的视角和数据支持,推动了相关研究的进展。
当前挑战
该数据集在构建和应用过程中面临的主要挑战包括:1)领域问题挑战:如何通过数据分析准确预测两个人是否可能成为约会对象,涉及复杂的心理和行为模式的建模;2)构建挑战:数据的收集过程中需确保参与者的隐私保护,同时要处理可能存在的数据偏差和缺失值问题。这些挑战不仅考验着数据集的质量,也对研究者的数据处理和分析能力提出了更高的要求。
常用场景
经典使用场景
在社会科学与人机交互领域,mstz/speeddating数据集常被用于研究约会匹配的预测模型。该数据集通过收集速配活动中参与者的个人特征及其对潜在约会对象的偏好,为研究人员提供了一个独特的机会,以探索影响双方是否愿意约会的多种因素。
衍生相关工作
基于mstz/speeddating数据集,研究者们已经衍生出一系列相关工作,包括构建预测模型来识别配对成功的可能性,以及探索不同文化背景下约会偏好的差异。这些研究不仅推动了社会科学的理论发展,也为实际应用提供了理论基础和技术支持。
数据集最近研究
最新研究方向
在人际交往与配对研究领域,mstz/speeddating数据集近期被用于探索个体间的相互吸引与配对成功概率的预测模型。该数据集通过分析约会者的个人特征、偏好及双方互动评分,旨在构建更为精准的匹配算法。当前研究不仅聚焦于二元分类任务,即预测双方是否能够成功配对,亦深入探讨影响配对决策的多种因素,如外貌吸引力、真诚度、智力、幽默感、事业心及共同兴趣的重要性。这些研究为在线约会平台的优化提供了重要参考,对于提升用户满意度和平台成功率具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作