American Housing Survey (AHS) national files|住房调查数据集|房地产市场数据集
收藏数据集概述
数据来源
- 数据集基于美国住房调查(AHS)的国家文件,自1985年以来的数据。
- 由美国住房和城市发展部公开,每两年更新一次,最新数据可用于2013年。
数据内容
- 住房层面变量:包括房间数量、建筑年份、占用状态(占用或空置)、租赁或拥有状态、单户或多户结构、建筑中的单位数量、当前市场价值和相对住房成本。
- 家庭层面变量:包括居住人数、家庭收入和居住地区类型(如城市或郊区)。
使用范围
- 本项目将使用2005年至2013年的数据,具体包括2005年、2007年、2009年、2011年和2013年的数据。
研究问题
1. 占用与未占用住房单位的市场价值差异及其随时间的变化趋势
- 描述性统计分析
- 比较两组(占用与未占用)的平均值
- 结论
2. 2008年次贷危机对住房租金的影响
- 合并2005至2013年的公平市场租金(FMR)数据
- 描述性统计分析
- 双样本假设检验
- 结论
3. 影响单户住宅市场价值的因素
- 回归模型中使用的变量及其使用理由
- 模型输出及变量间交互作用检查
- 解释模型中各变量对市场价值的影响
4. 预测同一物业的未来市场价值
- 使用2011年的自变量和2013年的因变量进行数据合并和清洗
- 模型评估,包括R平方和随机选择1000个住房单位的预测与实际比较,计算平均绝对偏差
数据分析方法
- 描述性统计分析
- 双样本假设检验
- 线性回归模型构建与解释
- 回归模型转换与解释
- 因变量预测
- 回归模型评估

Kaggle - Digit Recognizer
该数据集包含手写数字(0-9)的图像数据,用于训练和测试数字识别模型。数据集包括训练集和测试集,训练集包含42000个样本,每个样本是一个28x28像素的灰度图像,以及对应的标签。测试集包含28000个样本,用于评估模型的性能。
www.kaggle.com 收录
UniProt
UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。
www.uniprot.org 收录
ClinicalTrials.gov
Provides patients, family members, health care professionals, and members of the public easy access to information on clinical trials for a wide range of diseases and conditions.
OPEN DATA NETWORK 收录
flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录