five

Riichards/Sampl

收藏
Hugging Face2024-05-06 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Riichards/Sampl
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含两个表格:`bigquery-public-data.usa_names.usa_1910_2013`和`bigquery-public-data.samples.natality`。第一个表格记录了1910年至2013年间美国各州的婴儿名字、性别、出生年份及其出现次数。第二个表格包含了更详细的出生记录,如出生日期、性别、种族、体重、母亲和父亲的信息等。这些数据可用于分析美国婴儿名字的趋势、性别比例的变化以及其他与出生相关的统计信息。

该数据集包含两个表格:`bigquery-public-data.usa_names.usa_1910_2013`和`bigquery-public-data.samples.natality`。第一个表格记录了1910年至2013年间美国各州的婴儿名字、性别、出生年份及其出现次数。第二个表格包含了更详细的出生记录,如出生日期、性别、种族、体重、母亲和父亲的信息等。这些数据可用于分析美国婴儿名字的趋势、性别比例的变化以及其他与出生相关的统计信息。
提供机构:
Riichards
原始信息汇总

数据集概述

基本信息

  • 许可证: Apache-2.0
  • 任务类别: 文本分类
  • 语言: 英语
  • 数据集大小: 小于1千条记录

输入表

  • 表1: bigquery-public-data.usa_names.usa_1910_2013

    • 字段:
      • state: 2位州代码,类型为STRING
      • gender: 性别(M=男性,F=女性),类型为STRING
      • year: 出生年份,类型为INTEGER
      • name: 出生时的名字,类型为STRING
      • number: 名字出现的次数,类型为INTEGER
  • 表2: bigquery-public-data.samples.natality

    • 字段:
      • source_year: 出生年份,类型为INTEGER
      • year: 出生年份,类型为INTEGER
      • month: 出生月份,类型为INTEGER
      • day: 出生日期,类型为INTEGER
      • wday: 出生星期,类型为INTEGER
      • state: 州邮政代码,类型为STRING
      • is_male: 性别(TRUE=男性,FALSE=女性),类型为BOOLEAN
      • child_race: 儿童种族,类型为INTEGER
      • weight_pounds: 儿童体重,类型为FLOAT
      • plurality: 多胎情况,类型为INTEGER
      • apgar_1min: 出生后1分钟Apgar评分,类型为INTEGER
      • apgar_5min: 出生后5分钟Apgar评分,类型为INTEGER
      • mother_residence_state: 母亲居住州,类型为STRING
      • mother_race: 母亲种族,类型为INTEGER
      • mother_age: 母亲年龄,类型为INTEGER
      • gestation_weeks: 妊娠周数,类型为INTEGER
      • lmp: 末次月经日期,类型为STRING
      • mother_married: 母亲婚姻状态,类型为BOOLEAN
      • mother_birth_state: 母亲出生州,类型为STRING
      • cigarette_use: 母亲吸烟情况,类型为BOOLEAN
      • cigarettes_per_day: 每日吸烟量,类型为INTEGER
      • alcohol_use: 母亲饮酒情况,类型为BOOLEAN
      • drinks_per_week: 每周饮酒量,类型为INTEGER
      • weight_gain_pounds: 孕期体重增加,类型为INTEGER
      • born_alive_alive: 存活子女数,类型为INTEGER
      • born_alive_dead: 已故子女数,类型为INTEGER
      • born_dead: 流产子女数,类型为INTEGER
      • ever_born: 总生育数,类型为INTEGER
      • father_race: 父亲种族,类型为INTEGER
      • father_age: 父亲年龄,类型为INTEGER
      • record_weight: 记录权重,类型为INTEGER

研究任务

  • 分析名字最后一个字母与性别的关联性
  • 分析美国自1920年以来女性名字比例最高的年份
  • 观察女性与男性名字比例的特殊发展趋势
  • 找出60年代第四常见的男性名字
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作