five

California Demographic Data

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/mostly-ai/paper-DataLLM-materials
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个代表加州多样化人口的合成数据集,它根据现实世界的统计数据来反映年龄和种族的分布情况。数据集包含三个列:州(固定为“加州”),年龄组(包含多个分类),以及种族组(包括“拉丁裔”、“白人”、“亚洲/太平洋岛民”、“黑人”、“美洲原住民”和“多种族/其他”)。该数据集规模为10,000行,其任务是进行合成数据生成。

This dataset is a synthetic dataset representing the diverse population of California, which accurately reflects the age and racial distribution derived from real-world statistical data. It comprises three columns: State (fixed to "California"), Age Group (covering multiple categories), and Race Group (including "Hispanic/Latino", "White", "Asian/Pacific Islander", "Black", "Native American", and "Multiracial/Other"). The dataset contains 10,000 rows, and its designated task is synthetic data generation.
提供机构:
OpenAI API
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作