PsyQA|心理健康数据集|自然语言处理数据集
收藏PsyQA数据集概述
数据集简介
- 中文心理健康支持问答数据集
- 提供丰富的援助策略标注
- 可用于生成富有援助策略的长咨询文本
数据集获取
- 提供少量样例数据(PsyQA_example.json)
- 完整数据集获取流程:
- 下载【PsyQA数据集使用用户协议】
- 阅读并同意相关规定
- 填写用户信息、授权时间
- 电子签名
- 将签署的协议(pdf格式)发送至邮箱:thu-sunhao@foxmail.com
- 审核通过后邮件发送完整数据集下载链接
相关论文
- 标题:PsyQA: A Chinese Dataset for Generating Long Counseling Text for Mental Health Support
- 会议:Findings of ACL 2021
- arXiv链接:https://arxiv.org/abs/2106.01702
引用格式
bibtex @inproceedings{sun-etal-2021-psyqa, title = "PsyQA: A Chinese Dataset for Generating Long Counseling Text for Mental Health Support", author = "Sun, Hao and Lin, Zhenru and Zheng, Chujie and Liu, Siyang and Huang, Minlie", booktitle = "Findings of the Association for Computational Linguistics: ACL 2021", year = "2021", }
联系方式
- 联系人:孙豪
- 邮箱:thu-sunhao@foxmail.com

CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
olympics.csv
该数据集包含不同国家参加奥运会的奖牌榜,数据来源于维基百科的历届奥运会奖牌榜。
github 收录
MNLI
MNLI(Multi-Genre Natural Language Inference)是一个大规模的自然语言推理数据集,包含433,000多对句子对。该数据集用于评估模型在不同文本类型中的推理能力,包括新闻文章、小说、论坛帖子等。每个句子对都标注了三种可能的关系:蕴含(entailment)、矛盾(contradiction)和中性(neutral)。
cims.nyu.edu 收录