Mykes/rus_med_dialogues
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Mykes/rus_med_dialogues
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个俄语医疗对话数据集,包含2282个患者与医疗机器人的对话。数据集分为训练集和测试集,训练集包含2053个对话,测试集包含229个对话。数据集的特征包括医疗主题、用户-AI消息历史、用户最后的问题、AI的回复以及用于微调指令模型的提示。提示格式包括上下文、用户问题和AI回复。数据集主要用于研究目的,可能存在不准确、有害内容或偏见。
This dataset is a Russian-language medical conversation dataset containing 2282 patient conversations with a medical bot. The dataset is divided into a training set and a test set, with the training set containing 2053 conversations and the test set containing 229 conversations. The features of the dataset include medical topics, user-AI message history, the last user question, the AIs response, and prompts for fine-tuning instruction models. The prompt format includes context, user questions, and AI responses. The dataset is primarily intended for research purposes and may contain inaccuracies, harmful content, or biases.
提供机构:
Mykes
原始信息汇总
数据集概述
基本信息
- 语言: 俄语
- 许可证: MIT
- 数据集大小: 7.72 MB
- 下载大小: 3.30 MB
- 任务类别:
- 问答
- 文本分类
- 文本生成
数据集结构
- 特征:
topic: 字符串类型,医疗主题user_question: 字符串类型,用户问题assistant_answer: 字符串类型,AI回答to_doctor: 字符串类型__index_level_0__: 整数类型prompt: 字符串类型,用于微调指令模型的提示
数据分割
- 训练集:
- 样本数量: 3014
- 数据大小: 6.95 MB
- 测试集:
- 样本数量: 335
- 数据大小: 772.23 KB
数据集配置
- 配置名称: default
- 数据文件:
- 训练集路径:
data/train-* - 测试集路径:
data/test-*
- 训练集路径:
- 数据文件:
标签
- 医疗
- 生物学
- 合成数据
提示格式
Below is the context which is your conversation history and the last user question. Write a response according to the context and question.
Context:
{context}
Question:
{user_question}
Response:
{assistant_answer}
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



