Baby Names in The USA from 1880 to 2022|名字趋势数据集|文化研究数据集
收藏数据集概述
1. Baby Names in The USA from 1880 to 2022
- 数据集名称: bbnames.csv
- 数据来源: 美国社会保障局
- 数据量: 约200万个名字
- 时间范围: 1880年至2022年
- 变量:
- year: 出生年份
- sex: 性别(Female或Male)
- name: 婴儿名字
- n: 该年份该性别下名为"name"的婴儿数量
2. Pilot Certification Data
- 数据集名称: pilotsCertFAA2023.csv
- 数据来源: 美国联邦航空管理局(FAA)
- 获取时间: 2023年6月
- 内容: 飞行员认证记录
- 变量:
- Pilot ID: 飞行员ID
- CertLevel: 认证级别(Airline, Commercial, Student, Sport, Private, Recreational)
- STATE: 美国州份
- MedClass: 医疗级别
- MedExpMonth: 医疗证书到期月份
- MedExpYear: 医疗证书到期年份

Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录