five

dbdu/ShareGPT-74k-ko

收藏
Hugging Face2023-08-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dbdu/ShareGPT-74k-ko
下载链接
链接失效反馈
官方服务:
资源简介:
ShareGPT-ko-74k是ShareGPT 90k的韩语翻译版本,使用谷歌翻译工具进行翻译。数据集包含两个版本:`*_unclneaed.json`是未经过后处理的翻译数据,包含74k条对话;`*_cleaned.json`是经过后处理的数据,移除了包含代码片段的对话,包含55k条对话。建议使用清理后的版本,因为代码片段可能已被翻译成韩语。

ShareGPT-ko-74k是ShareGPT 90k的韩语翻译版本,使用谷歌翻译工具进行翻译。数据集包含两个版本:`*_unclneaed.json`是未经过后处理的翻译数据,包含74k条对话;`*_cleaned.json`是经过后处理的数据,移除了包含代码片段的对话,包含55k条对话。建议使用清理后的版本,因为代码片段可能已被翻译成韩语。
提供机构:
dbdu
原始信息汇总

数据集概述

数据集名称

  • ShareGPT-ko-74k

语言

  • 韩语(ko)

标签

  • 对话
  • ChatGPT
  • GPT-3.5

许可证

  • CC BY 2.0

任务类别

  • 文本生成

大小类别

  • 10K<n<100K

数据集描述

  • 结构:与原始数据集相同,包含JSON文件。
  • 文件类型
    • *_unclneaed.json:未经后处理的韩语翻译数据,共74k对话。
    • *_cleaned.json:从上述数据中去除包含代码片段的对话,共55k对话。
  • 注意事项:代码片段可能已被翻译成韩语,推荐使用*_cleaned.json文件。

许可证信息

  • 由于数据集包含GPT生成的内容,遵循OPENAI的许可证。
  • 其他情况遵循CC BY 2.0 KR许可证。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作