cnmoro/GPT4-500k-Augmented-PTBR-Clean
收藏Hugging Face2024-04-03 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/cnmoro/GPT4-500k-Augmented-PTBR-Clean
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是Open-Orca/1million-gpt-4数据集的葡萄牙语翻译版本,移除了包含非拉丁字符的指令和响应,以及编码相关的任务。数据集的任务类别为文本生成,语言为葡萄牙语,规模在10万到100万之间。
该数据集是Open-Orca/1million-gpt-4数据集的葡萄牙语翻译版本,移除了包含非拉丁字符的指令和响应,以及编码相关的任务。数据集的任务类别为文本生成,语言为葡萄牙语,规模在10万到100万之间。
提供机构:
cnmoro
原始信息汇总
数据集概述
许可证
- MIT
任务类别
- 文本生成
语言
- 葡萄牙语(pt)
数据集大小
- 100K < n < 1M
数据集描述
- 该数据集是Open-Orca/1million-gpt-4的葡萄牙语翻译版本。
- 已移除包含非拉丁字符的指令和响应,以及与编程相关的任务。



