five

HipAAsynth/synthetic-minot-nd

收藏
Hugging Face2026-03-25 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/HipAAsynth/synthetic-minot-nd
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: cc-by-nc-4.0 task_categories: - tabular-classification - tabular-regression tags: - synthetic - healthcare - EHR - deterministic - hipaasynth - north-dakota - minot - population-calibrated - census version: "1.0.0" size_categories: - n<1K configs: - config_name: default data_files: - split: train path: "synthetic_minot_nd_sample_100_seed1001.csv" --- # Synthetic Minot, ND — Population-Calibrated Cohort 100-patient sample from a full 47,440-patient deterministic synthetic cohort calibrated to U.S. Census data for Minot, North Dakota. ## What This Is A sample from HipAAsynth's population-calibrated synthetic cohort for Minot, ND. Demographics match Census Bureau QuickFacts / ACS 2020-2024 data. Condition prevalence flows from CDC/NHANES age-stratified tables applied to this demographic profile. Full 47,440-patient cohort available from the website. ## This Is a Sample This dataset contains 100 patients. The complete cohort contains 47,440 synthetic patients matching Minot's actual population. Full cohorts are available at [hipaasynth.com/request](https://hipaasynth.com/request.html). ## Population Profile | Property | Value | Source | |----------|-------|--------| | City | Minot, ND | — | | Actual Population | 47,440 | Census QuickFacts July 2025 | | Sample Size | 100 | — | | Seed | 1001 | — | | Female % | 47.8% | Census QuickFacts 2020-2024 | | White | 79.5% | Census QuickFacts 2020-2024 | | Black | 5.5% | Census QuickFacts 2020-2024 | | Hispanic | 7.9% | Census QuickFacts 2020-2024 | | Asian | 2.1% | Census QuickFacts 2020-2024 | | Native | 2.3% | Census QuickFacts 2020-2024 | ## Age Distribution | Band | Weight | Source | |------|--------|--------| | 18-24 | 14% | ACS 2020-2024 | | 25-44 | 34% | ACS 2020-2024 | | 45-64 | 26% | ACS 2020-2024 | | 65-90 | 26% | ACS 2020-2024 | ## Format Standardized 13-column CSV: | Column | Description | |--------|-------------| | patient_id | Unique patient identifier | | age | Patient age | | sex | Patient sex | | ethnicity | Patient ethnicity | | height_cm | Height in centimeters | | weight_kg | Weight in kilograms | | bmi | Body mass index | | bmi_category | BMI classification | | conditions | Pipe-delimited condition list | | num_visits | Number of clinical visits | | num_labs | Number of lab results | | synthetic | Always True | | disclaimer | Synthetic data disclaimer | ## Reproducibility Deterministic generation produces identical output across runs. Same seed = same dataset, always. ## License Data Packs: CC BY-NC 4.0 Proprietary implementation. Structured, inspectable, auditable outputs. Purchase of data packs or outputs does not transfer ownership of the engine or implementation details. Commercial license and usage terms apply. ## Legal Disclaimer HipAAsynth outputs are synthetic and contain no real patient data or protected health information. Products and datasets are intended for testing, development, research, and benchmarking. They are not intended for clinical decision-making, diagnosis, treatment, or patient care. ## Links - Website: [HipAAsynth.com](https://hipaasynth.com) - Request Full Cohort: [hipaasynth.com/request](https://hipaasynth.com/request.html) - Contact: [HipAAsynth@gmail.com](mailto:HipAAsynth@gmail.com) ## Version History | Version | Date | Changes | |---------|------|---------| | 1.0.0 | March 2026 | Initial release. 100-patient sample, seed 1001. |

license: CC BY-NC 4.0 task_categories: - 表格分类 - 表格回归 tags: - 合成数据 - 医疗保健 - 电子健康记录(Electronic Health Record, EHR) - 确定性生成 - HipAAsynth - 北达科他州 - 迈诺特 - 人口校准 - 人口普查 version: "1.0.0" size_categories: - n<1K configs: - config_name: default data_files: - split: train path: "synthetic_minot_nd_sample_100_seed1001.csv" # 北达科他州迈诺特市合成数据集——人口校准队列 本数据集为完整47440例确定性合成队列的100例患者子集,该完整队列已基于美国北达科他州迈诺特市的人口普查数据完成校准。 ## 数据集说明 本数据集源自HipAAsynth平台针对迈诺特市构建的人口校准合成队列子集。其人口统计学特征匹配美国人口普查局QuickFacts及2020-2024年美国社区调查(American Community Survey, ACS)数据,疾病患病率则基于美国疾病控制与预防中心(Centers for Disease Control and Prevention, CDC)/美国国家健康与营养检查调查(National Health and Nutrition Examination Survey, NHANES)的年龄分层数据表,结合本数据集的人口统计学特征生成。完整的47440例患者队列可通过官方网站获取。 ## 数据集规模说明 本数据集仅包含100例患者,完整队列共包含47440例合成患者,其人口结构与迈诺特市实际人口一致。完整队列可通过[hipaasynth.com/request](https://hipaasynth.com/request.html)申请获取。 ## 人口统计学特征表 | 特征属性 | 取值 | 数据来源 | |----------|-------|--------| | 城市 | 北达科他州迈诺特市 | 无 | | 实际总人口 | 47440 | 2025年7月人口普查快速统计数据(Census QuickFacts) | | 样本量 | 100 | 无 | | 随机种子 | 1001 | 无 | | 女性占比 | 47.8% | 2020-2024年人口普查快速统计数据 | | 白人占比 | 79.5% | 2020-2024年人口普查快速统计数据 | | 黑人占比 | 5.5% | 2020-2024年人口普查快速统计数据 | | 西班牙裔占比 | 7.9% | 2020-2024年人口普查快速统计数据 | | 亚裔占比 | 2.1% | 2020-2024年人口普查快速统计数据 | | 原住民占比 | 2.3% | 2020-2024年人口普查快速统计数据 | ## 年龄分布情况 | 年龄区间 | 权重占比 | 数据来源 | |------|--------|--------| | 18-24岁 | 14% | 2020-2024年美国社区调查数据 | | 25-44岁 | 34% | 2020-2024年美国社区调查数据 | | 45-64岁 | 26% | 2020-2024年美国社区调查数据 | | 65-90岁 | 26% | 2020-2024年美国社区调查数据 | ## 数据格式 采用标准化13列CSV格式: | 列名 | 字段说明 | |--------|-------------| | patient_id | 唯一患者标识符 | | age | 患者年龄 | | sex | 患者性别 | | ethnicity | 患者种族族裔 | | height_cm | 身高(单位:厘米) | | weight_kg | 体重(单位:千克) | | bmi | 身体质量指数 | | bmi_category | BMI分类 | | conditions | 竖线分隔的疾病列表 | | num_visits | 临床就诊次数 | | num_labs | 实验室检测次数 | | synthetic | 固定为True,标识为合成数据 | | disclaimer | 合成数据声明文本 | ## 可复现性说明 本数据集采用确定性生成方式,不同运行批次将生成完全一致的输出结果。只要使用相同的随机种子,即可得到完全相同的数据集。 ## 许可证说明 数据集打包版本采用CC BY-NC 4.0许可证。其核心实现为专有技术,生成的数据结构清晰、可检查且可审计。购买数据集打包版本或生成结果,并不代表获得了该生成引擎或其实现细节的所有权。商业许可证及使用条款另有规定。 ## 法律声明 HipAAsynth平台生成的所有数据均为合成数据,不包含任何真实患者数据或受保护的健康信息。本产品及数据集仅用于测试、开发、研究及基准测试,不得用于临床决策、诊断、治疗或患者护理相关场景。 ## 相关链接 - 官方网站:[HipAAsynth.com](https://hipaasynth.com) - 申请完整队列:[hipaasynth.com/request](https://hipaasynth.com/request.html) - 联系方式:[HipAAsynth@gmail.com](mailto:HipAAsynth@gmail.com) ## 版本历史 | 版本号 | 发布日期 | 更新内容 | |---------|------|---------| | 1.0.0 | 2026年3月 | 初始发布。包含100例患者样本,随机种子为1001。
提供机构:
HipAAsynth
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作