five

ShareGPT 90k 中英文双语人机问答数据集

收藏
超神经2024-02-27 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/29523
下载链接
链接失效反馈
官方服务:
资源简介:
ShareGPT-Chinese-English-90k 是中英文平行双语优质人机问答数据集,覆盖真实复杂场景下的用户提问。可用于训练高质量的对话模型(比那些通过反复调用 API 接口生成机器模拟问答的数据在指令分布上更鲁棒)。

ShareGPT-Chinese-English-90k is a high-quality parallel bilingual human-machine question answering dataset covering user queries in real and complex scenarios. It can be used to train high-quality dialogue models, which is more robust in terms of instruction distribution compared to datasets that generate simulated human-machine question-answer pairs through repeated API calls.
创建时间:
2024-02-20
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ShareGPT 90k 是一个中英文平行双语人机问答数据集,包含真实场景下的用户提问,适用于训练高质量的对话模型。其特点在于提供中英文对照语料,问题非人为臆造且更符合真实用户分布,并通过网友分享自然过滤了低质量对话。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务