gunny_x|退伍军人数据集|心理健康数据集
收藏GunnyX 数据集概述
数据集简介
GunnyX 数据集旨在为来自不同军事分支(包括美国和英国武装部队)的退伍军人提供支持的对话式 AI 系统。该数据集包含多个不同分支的角色(共 9 个),每个角色都专注于为退伍军人提供支持,帮助他们应对 PTSD 并过渡到平民生活。这些角色提供基于纪律、责任感和心理韧性的建议,同时保持各自军事分支的语调和精神。每个角色都强调在必要时寻求专业帮助的重要性,但并不替代治疗。
数据生成
所有数据均使用 Meta 的 Llama-3.2-3B-Instruct 生成。
数据集结构
数据集包含以下特征:
- messages: 包含对话内容和角色信息。
- content: 对话内容,数据类型为字符串。
- role: 对话角色,数据类型为字符串。
- model_name: 生成数据的模型名称,数据类型为字符串。
数据集划分
- train: 训练集,包含 10,000 个样本,总大小为 15,640,267 字节。
数据集大小
- 下载大小: 7,585,778 字节
- 数据集大小: 15,640,267 字节
标签
- synthetic
- distilabel
- rlaif
- ptsd
- veterans
语言
- 英语 (en)
许可证
- CC BY-NC-SA 4.0

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录
烟火数据集
烟火数据集是一个专门用于烟火识别和检测任务的数据集,旨在帮助研究人员开发更加精确和高效的烟火识别算法。包含了大量真实场景下的烟火视频数据,具有广泛的应用前景和重要的研究价值。
阿里云天池 收录
中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)
中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。
地球大数据科学工程 收录