Riichards/Sampl
收藏Hugging Face2024-05-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Riichards/Sampl
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个表格:`bigquery-public-data.usa_names.usa_1910_2013`和`bigquery-public-data.samples.natality`。第一个表格记录了1910年至2013年间美国各州的婴儿名字、性别、出生年份及其出现次数。第二个表格包含了更详细的出生记录,如出生日期、性别、种族、体重、母亲和父亲的信息等。这些数据可用于分析美国婴儿名字的趋势、性别比例的变化以及其他与出生相关的统计信息。
该数据集包含两个表格:`bigquery-public-data.usa_names.usa_1910_2013`和`bigquery-public-data.samples.natality`。第一个表格记录了1910年至2013年间美国各州的婴儿名字、性别、出生年份及其出现次数。第二个表格包含了更详细的出生记录,如出生日期、性别、种族、体重、母亲和父亲的信息等。这些数据可用于分析美国婴儿名字的趋势、性别比例的变化以及其他与出生相关的统计信息。
提供机构:
Riichards
原始信息汇总
数据集概述
基本信息
- 许可证: Apache-2.0
- 任务类别: 文本分类
- 语言: 英语
- 数据集大小: 小于1千条记录
输入表
-
表1:
bigquery-public-data.usa_names.usa_1910_2013- 字段:
state: 2位州代码,类型为STRINGgender: 性别(M=男性,F=女性),类型为STRINGyear: 出生年份,类型为INTEGERname: 出生时的名字,类型为STRINGnumber: 名字出现的次数,类型为INTEGER
- 字段:
-
表2:
bigquery-public-data.samples.natality- 字段:
source_year: 出生年份,类型为INTEGERyear: 出生年份,类型为INTEGERmonth: 出生月份,类型为INTEGERday: 出生日期,类型为INTEGERwday: 出生星期,类型为INTEGERstate: 州邮政代码,类型为STRINGis_male: 性别(TRUE=男性,FALSE=女性),类型为BOOLEANchild_race: 儿童种族,类型为INTEGERweight_pounds: 儿童体重,类型为FLOATplurality: 多胎情况,类型为INTEGERapgar_1min: 出生后1分钟Apgar评分,类型为INTEGERapgar_5min: 出生后5分钟Apgar评分,类型为INTEGERmother_residence_state: 母亲居住州,类型为STRINGmother_race: 母亲种族,类型为INTEGERmother_age: 母亲年龄,类型为INTEGERgestation_weeks: 妊娠周数,类型为INTEGERlmp: 末次月经日期,类型为STRINGmother_married: 母亲婚姻状态,类型为BOOLEANmother_birth_state: 母亲出生州,类型为STRINGcigarette_use: 母亲吸烟情况,类型为BOOLEANcigarettes_per_day: 每日吸烟量,类型为INTEGERalcohol_use: 母亲饮酒情况,类型为BOOLEANdrinks_per_week: 每周饮酒量,类型为INTEGERweight_gain_pounds: 孕期体重增加,类型为INTEGERborn_alive_alive: 存活子女数,类型为INTEGERborn_alive_dead: 已故子女数,类型为INTEGERborn_dead: 流产子女数,类型为INTEGERever_born: 总生育数,类型为INTEGERfather_race: 父亲种族,类型为INTEGERfather_age: 父亲年龄,类型为INTEGERrecord_weight: 记录权重,类型为INTEGER
- 字段:
研究任务
- 分析名字最后一个字母与性别的关联性
- 分析美国自1920年以来女性名字比例最高的年份
- 观察女性与男性名字比例的特殊发展趋势
- 找出60年代第四常见的男性名字



