five

KMI

收藏
arXiv2025-02-09 更新2025-02-12 收录
下载链接:
https://github.com/hjkim811/KMI
下载链接
链接失效反馈
官方服务:
资源简介:
KMI数据集是由首尔国立大学等机构创建的,包含1000个高质量的韩语动机访谈对话。该数据集基于动机访谈理论,使用大型语言模型生成对话,旨在解决心理健康支持聊天机器人在数据方面的短缺问题,特别是在非英语语言环境中。数据集中的对话涵盖了韩国人常见的各种担忧和焦虑,同时整合了专业治疗师的行为策略。

The KMI Dataset was developed by institutions including Seoul National University, and contains 1,000 high-quality Korean motivational interviewing dialogues. Grounded in motivational interviewing theory, this dataset uses large language models to generate the dialogues, aiming to address the shortage of training data for mental health support chatbots, particularly in non-English language contexts. The dialogues cover a wide range of common worries and anxieties among Korean people, while incorporating behavioral strategies from professional therapists.
提供机构:
首尔国立大学, 韩国咨询研究生大学
创建时间:
2025-02-09
搜集汇总
数据集介绍
main_image_url
构建方式
KMI数据集的构建是通过模拟动机性访谈(MI)会话来完成的。首先,从韩国心理咨询服务平台Mindcafe收集反映韩国人常见心理问题和焦虑的帖子作为上下文数据。然后,使用大型语言模型(LLM)和动机性访谈预测模型来模拟治疗师和客户的对话。治疗师模拟器根据MI行为编码系统中的八个标签来生成回应,并使用MI预测模型来预测治疗师的下一个行为。客户模拟器则根据上下文和对话历史生成客户的话语,并在适当的时候使用“变化对话”来模拟客户的变化意愿。最后,将生成的对话与治疗师行为标签一起存储在KMI数据集中。
特点
KMI数据集具有以下几个特点:首先,它是第一个基于MI理论的合成数据集,包含1000个高质量的韩语动机性访谈对话。其次,KMI数据集克服了现有数据集的局限性,例如缺乏专业知识和数量不足。最后,KMI数据集在MI质量、一致性、流畅性和主题相关性方面都表现出色。
使用方法
KMI数据集可以用于开发基于MI理论的心理健康聊天机器人,也可以用作分类和预测任务的标签数据集。此外,KMI数据集还可以作为MI从业者的参考,提供高质量的、全面的对话案例。
背景与挑战
背景概述
随着社会对心理健康服务的需求日益增长,人工智能驱动的心理健康聊天机器人的开发也日益受到关注。然而,现有的数据集在训练聊天机器人方面存在局限性,导致了对基于动机性访谈(MI)理论的公开可用资源的迫切需求。特别是在非英语语言领域,这个问题更为突出。KMI数据集的创建正是为了解决这一问题。KMI数据集由韩国首尔国立大学的研究人员于2025年提出,是第一个基于MI理论的合成数据集,包含1000个高质量的韩语动机性访谈对话。该数据集旨在通过模拟专业治疗师的行为选择,利用大型语言模型(LLMs)生成对话,以提高聊天机器人在心理健康支持方面的专业能力。KMI数据集的创建填补了MI和心理健康支持领域的空白,为相关研究提供了宝贵的资源。
当前挑战
尽管KMI数据集的创建为心理健康支持聊天机器人的开发提供了宝贵的资源,但仍面临一些挑战。首先,所解决的领域问题,即心理健康支持聊天机器人的开发,需要解决隐私问题、数据收集和专业知识等方面的挑战。其次,在构建KMI数据集的过程中,研究人员面临着如何模拟专业治疗师的行为选择、如何生成高质量对话等挑战。此外,KMI数据集的评估也是一个挑战,需要引入新的评估指标来衡量对话是否符合MI理论。最后,由于KMI数据集是基于韩语构建的,因此在推广到其他语言和文化背景时可能需要进一步的调整和优化。
常用场景
经典使用场景
KMI数据集的经典使用场景包括:1. 训练动机性访谈(MI)驱动的心理健康聊天机器人,以便为用户提供基于MI理论的心理健康支持。2. 作为MI行为编码系统的标注数据集,用于分类和预测任务。3. 为MI实践者提供参考,提供高质量的、完整的治疗对话案例。4. 作为开发非英语语言MI资源的基础,促进心理健康支持在不同语言和文化中的应用。
实际应用
KMI数据集的实际应用场景包括:1. 心理健康聊天机器人的开发,为用户提供基于MI理论的心理健康支持。2. MI行为编码系统的训练,用于自动分类和预测任务。3. MI实践者的参考,提供高质量的、完整的治疗对话案例。4. 非英语语言MI资源的开发,促进心理健康支持在不同语言和文化中的应用。
衍生相关工作
KMI数据集衍生了以下相关工作:1. 基于MI理论的合成对话生成框架。2. 使用LLM生成MI对话的技术。3. MI行为编码系统的训练和评估。4. MI理论指标的开发和评估。这些工作进一步推动了心理健康领域的研究和应用,为开发MI驱动的心理健康聊天机器人提供了重要的技术支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作