dbdu/ShareGPT-74k-ko
收藏Hugging Face2023-08-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dbdu/ShareGPT-74k-ko
下载链接
链接失效反馈官方服务:
资源简介:
ShareGPT-ko-74k是ShareGPT 90k的韩语翻译版本,使用谷歌翻译工具进行翻译。数据集包含两个版本:`*_unclneaed.json`是未经过后处理的翻译数据,包含74k条对话;`*_cleaned.json`是经过后处理的数据,移除了包含代码片段的对话,包含55k条对话。建议使用清理后的版本,因为代码片段可能已被翻译成韩语。
ShareGPT-ko-74k是ShareGPT 90k的韩语翻译版本,使用谷歌翻译工具进行翻译。数据集包含两个版本:`*_unclneaed.json`是未经过后处理的翻译数据,包含74k条对话;`*_cleaned.json`是经过后处理的数据,移除了包含代码片段的对话,包含55k条对话。建议使用清理后的版本,因为代码片段可能已被翻译成韩语。
提供机构:
dbdu
原始信息汇总
数据集概述
数据集名称
- ShareGPT-ko-74k
语言
- 韩语(ko)
标签
- 对话
- ChatGPT
- GPT-3.5
许可证
- CC BY 2.0
任务类别
- 文本生成
大小类别
- 10K<n<100K
数据集描述
- 结构:与原始数据集相同,包含JSON文件。
- 文件类型:
*_unclneaed.json:未经后处理的韩语翻译数据,共74k对话。*_cleaned.json:从上述数据中去除包含代码片段的对话,共55k对话。
- 注意事项:代码片段可能已被翻译成韩语,推荐使用
*_cleaned.json文件。
许可证信息
- 由于数据集包含GPT生成的内容,遵循OPENAI的许可证。
- 其他情况遵循CC BY 2.0 KR许可证。



