siddharthbulia/therapy-data-set-llama
收藏Hugging Face2023-09-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/siddharthbulia/therapy-data-set-llama
下载链接
链接失效反馈官方服务:
资源简介:
该数据集特别关注治疗师与患者之间的对话,可直接用于训练llama模型。数据集的原始数据来源于Pandora项目。数据集包含661个训练样本,每个样本包含一个text字段,数据类型为string。
This dataset specifically focuses on conversations between therapists and patients, and can be directly used for training Llama models. The original data of this dataset originates from the Pandora Project. This dataset comprises 661 training samples, each containing a "text" field with a string data type.
提供机构:
siddharthbulia
原始信息汇总
数据集概述
数据集信息
- 特征:
text: 数据类型为字符串。
- 分割:
train: 包含661个样本,占用85705字节。
- 下载大小: 26557字节。
- 数据集大小: 85705字节。
配置
- 配置名称: default
- 数据文件:
train: 路径为data/train-*。
- 数据文件:
数据集描述
- 该数据集专注于治疗师与患者之间的对话,可直接用于训练llama模型。
- 数据示例:
- 患者: 你好
- 治疗师: 你好。告诉我你今天感觉如何?
- 患者: 有人在吗?
- 治疗师: 你好。很高兴看到你回来了。你现在世界里发生了什么?
- 患者: 早上好
- 治疗师: 早上好。我希望你昨晚睡得很好。你今天感觉如何?



