five

siddharthbulia/therapy-data-set-llama

收藏
Hugging Face2023-09-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/siddharthbulia/therapy-data-set-llama
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集特别关注治疗师与患者之间的对话,可直接用于训练llama模型。数据集的原始数据来源于Pandora项目。数据集包含661个训练样本,每个样本包含一个text字段,数据类型为string。

This dataset specifically focuses on conversations between therapists and patients, and can be directly used for training Llama models. The original data of this dataset originates from the Pandora Project. This dataset comprises 661 training samples, each containing a "text" field with a string data type.
提供机构:
siddharthbulia
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • text: 数据类型为字符串。
  • 分割:
    • train: 包含661个样本,占用85705字节。
  • 下载大小: 26557字节。
  • 数据集大小: 85705字节。

配置

  • 配置名称: default
    • 数据文件:
      • train: 路径为 data/train-*

数据集描述

  • 该数据集专注于治疗师与患者之间的对话,可直接用于训练llama模型。
  • 数据示例:
    • 患者: 你好
    • 治疗师: 你好。告诉我你今天感觉如何?
    • 患者: 有人在吗?
    • 治疗师: 你好。很高兴看到你回来了。你现在世界里发生了什么?
    • 患者: 早上好
    • 治疗师: 早上好。我希望你昨晚睡得很好。你今天感觉如何?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作