PRAMS|孕产妇健康数据集|生育数据数据集
收藏
- PRAMS数据集首次发表,旨在收集和分析孕产妇和婴儿健康相关的数据,以改善公共卫生政策。
- PRAMS数据集首次应用于美国多个州的公共卫生研究,为孕产妇和婴儿健康提供了重要的数据支持。
- PRAMS数据集扩展至更多州,数据收集和分析方法得到进一步优化,提高了数据的质量和可靠性。
- PRAMS数据集开始采用电子数据收集系统,显著提高了数据收集的效率和准确性。
- PRAMS数据集的数据分析方法得到更新,引入了更多先进的统计和机器学习技术,提升了数据分析的深度和广度。
- PRAMS数据集在全球公共卫生领域的影响力显著提升,成为孕产妇和婴儿健康研究的重要数据来源。
- 1The Pregnancy Risk Assessment Monitoring System (PRAMS): A National Surveillance SystemCenters for Disease Control and Prevention (CDC) · 2004年
- 2Pregnancy Risk Assessment Monitoring System (PRAMS): Overview and Summary of Recent FindingsCenters for Disease Control and Prevention (CDC) · 2020年
- 3Using the Pregnancy Risk Assessment Monitoring System (PRAMS) to Identify and Address Maternal Health DisparitiesCenters for Disease Control and Prevention (CDC) · 2018年
- 4Pregnancy Risk Assessment Monitoring System (PRAMS): Methodology and Data QualityCenters for Disease Control and Prevention (CDC) · 2016年
- 5Pregnancy Risk Assessment Monitoring System (PRAMS): Data for Action to Improve Maternal and Infant HealthCenters for Disease Control and Prevention (CDC) · 2014年
高质量多领域客服对话数据集
高质量多领域客服对话数据集,包含了电子商务、金融服务、电信支持等多个领域,包含丰富的问答对。旨在提供多样化的客户服务场景下的自然语言交互样本。高质量多领域客服对话数据集在大模型领域的应用能够解决以下几个关键问题: 1)聊天机器人训练:通过使用丰富的对话数据,可以训练出更加自然、流畅且能理解复杂用户意图的聊天机器人。 2)智能客服助手:能够提升客服系统的自动化水平,有效解答常见问题,减少人工客服的工作负担,提高服务效率和客户满意度。 3)多轮对话系统开发:支持构建能够进行连贯、上下文相关的多轮对话系统,使得机器能够在对话中保持话题一致性,提供更个性化的交互体验。 4)智能推荐系统:利用对话数据中的用户偏好和行为模式,改进推荐算法,实现更精准的内容和服务推荐。 5)知识库构建:有助于自动或半自动地构建和维护企业或特定领域的知识图谱,为用户提供准确的信息查询服务。 6)语言模型预训练:可以作为预训练数据,帮助语言模型学习多样化的语言结构和表达方式,增强模型的语言理解和生成能力。
北京市数据知识产权 收录
CodeGen
CodeGen数据集是一个用于代码生成和理解的大型数据集,包含了多种编程语言的代码片段和相应的自然语言描述。该数据集旨在帮助研究人员和开发者训练和评估代码生成模型,提高代码生成的准确性和效率。
github.com 收录
Asteroids by the Minor Planet Center
包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。
github 收录
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
TM-Senti
TM-Senti是由伦敦玛丽女王大学开发的一个大规模、远距离监督的Twitter情感数据集,包含超过1.84亿条推文,覆盖了超过七年的时间跨度。该数据集基于互联网档案馆的公开推文存档,可以完全重新构建,包括推文元数据且无缺失推文。数据集内容丰富,涵盖多种语言,主要用于情感分析和文本分类等任务。创建过程中,研究团队精心筛选了表情符号和表情,确保数据集的质量和多样性。该数据集的应用领域广泛,旨在解决社交媒体情感表达的长期变化问题,特别是在表情符号和表情使用上的趋势分析。
arXiv 收录