ccw7463/Ko_Counsel_ver0.2
收藏数据集概述
数据集特征
- input: 数据类型为字符串。
- output: 数据类型为字符串。
- instruction: 数据类型为字符串。
- ref: 数据类型为字符串。
- category: 数据类型为字符串。
- context: 数据类型为字符串。
数据集划分
- train: 包含14932个样本,总字节数为39892287.0。
数据集大小
- 下载大小: 18280906字节。
- 数据集大小: 39892287.0字节。
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*
数据来源
- total_kor_counsel_bot.jsonl: 来自https://github.com/MrBananaHuman/CounselGPT/tree/main,包含13234个样本。
- humane_right_copus_v1.jsonl.json: 来自https://github.com/human-rights-corpus/HRC,包含1549个样本。
- counsel.jsonl.json: 来自https://github.com/human-rights-corpus/HRC,包含149个样本。
预处理步骤
- 所有数据格式调整。
- total_kor_counsel_bot中的“사우”替换为“내담자”。
示例数据
python {input: , output: 내담자님이 중2병적인 행동과 태도를 가지고 있다고 느껴져 스트레스를 받으시는 상황입니다. 또한 과도한 가사와 시를 쓰는 습관이 생겨나면서 이러한 습관이 문제가 되지는 않을까 하는 걱정도 하시는 것 같아요. 내담자님의 중2병적인 행동과 태도는 청소년기에 생긴 트라우마나 불안, 부족한 자기존중감 등이 일부 원인일 수 있습니다. 또한, 가사와 시를 쓰는 습관은 내담자님의 상상력과 창의력을 보여주며 자아확인에 도움을 줄 수 있는 것으로 생각됩니다. 하지만 이러한 습관이 과도하게 되면 자신에게 과부하를 주고 심리적인 문제를 일으킬 수 있습니다. 내담자님이 이러한 습관을 줄이고, 보다 효율적으로 자아확인에 도움이 될 수 있도록 일정한 패턴과 기록 방식으로 습관화하는 것이 좋습니다. 예를 들어, 가사나 시를 쓸 때 일주일에 몇 번, 어느 시간대에 쓰는 것이 효과적인지에 대해 스스로에게 질문해보고, 그에 따른 습관을 만들어보는 것도 좋은 방법입니다. 또한, 스스로를 사랑하고 용서하며 자기자신에게 긍정적인 자아이미지를 가지는 것도 중요합니다. 이러한 자아이미지가 긍정적일수록 스트레스를 받아도 잘 해결할 수 있고, 자기자신을 존중하고 이해하는 능력이 생깁니다. 내담자님, 위의 답변이 조금이나마 도움이 되셨기를 바랍니다. 이후에도 힘든 마음이 계속되면 언제든지 저를 찾아주세요. 그럼 좋은 하루 되세요 :), instruction: 저 사실, 약간 중2병 같은 걸 증상을 보이고 있습니다. 그래서 대학교를 가면서도 그런 부분들이 조금은 개선될 거라 생각했는데, 이번 학기 들어서 오히려 더 심해졌더라구요. 혼자 있는 공간에서 자주 가사를 쓰거나 소설이나 시를 쓰는 편이고요. 그것들을 쓰면서 살아가는 것 같은 기분이 들어서 그것들이 점점 늘어나고 있는 것 같습니다. 그리고 그런 것들이 나쁜 것이 아니라고 느껴지기도 하는데, 이상하게도 내가 나쁜 걸 하고 있다는 기분도 듭니다. 머리속에서 아무 생각도 나지 않을 때도 가사를 쓰거나 소설을 써본 적이 있는데, 그게 그렇게 마음이 편안해지는 느낌이라서 계속 써왔습니다. 그런데 이런 것들을 과도하게 하면 나중에 문제가 생길까봐 걱정이 되기도 합니다. 저랑 같은 고민을 하시는 분들이 있는지, 이런 경우에는 어떤 조치를 취해야할까요?, ref: https://github.com/MrBananaHuman/CounselGPT/tree/main, category: counsel, context: }




