lsy641/PsyQA|心理学问答数据集|自然语言处理数据集
收藏数据集概述
数据来源
- 原始数据来源于Sun et al, 2021的研究。
数据处理
- Liu et al, 2023对数据进行了处理,通过Hugging Face API将其转换为一个包含训练、验证和测试集的数据集。
引用信息
-
引用Liu et al, 2023的研究时,应使用以下引用格式:
@misc{liu2023enhancing, title={Enhancing Long-form Text Generation in Mental Health with Task-adaptive Tokenization}, author={Siyang Liu and Naihao Deng and Sahand Sabour and Yilin Jia and Minlie Huang and Rada Mihalcea}, year={2023}, eprint={2310.05317}, archivePrefix={arXiv}, primaryClass={cs.CL} }
-
引用Sun et al, 2021的研究时,应使用以下引用格式:
@inproceedings{sun2021psyqa, title={PsyQA: A Chinese Dataset for Generating Long Counseling Text for Mental Health Support}, author={Sun, Hao and Lin, Zhenru and Zheng, Chujie and Liu, Siyang and Huang, Minlie}, booktitle={Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021}, pages={1489--1503}, year={2021} }
许可证
- 数据集遵循MIT许可证。

YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
中国区域环境数据库
该数据集包含中国各区域的环境数据,涵盖空气质量、水质、土壤污染等多个方面的指标。数据以时间序列的形式记录,便于进行长期的环境变化分析。
www.mee.gov.cn 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
Club Football Match Data (2000 - 2025)
该数据集提供了一个简单的入口,用于分析全球27个国家和42个联赛的足球比赛数据,包括英超、德甲和西甲等顶级联赛。数据涵盖了从2000/01赛季到2024/25赛季的最新比赛结果。数据集还包括Elo评分,每月的1号和15号对欧洲约500支最佳球队进行快照。
github 收录
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录