baike_qa2019 百科类问答 json 版数据集
收藏超神经2024-07-17 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/32929
下载链接
链接失效反馈官方服务:
资源简介:
该数据集含有 150 万个预先过滤过的、高质量问题和答案,每个问题属于一个类别。总共有 492 个类别,其中频率达到或超过 10 次的类别有 434 个。
This dataset consists of 1.5 million pre-filtered, high-quality question-answer pairs, with each question assigned to a specific category. There are 492 categories in total, and 434 of these categories have a frequency of no less than 10.
创建时间:
2024-07-16
搜集汇总
数据集介绍

背景与挑战
背景概述
baike_qa2019是一个百科类问答JSON格式数据集,包含150万条经过筛选的高质量问答对,涵盖492个类别,其中434个类别的出现频率不低于10次。该数据集适用于自然语言处理、智能问答和文本生成等任务,文件大小为655.16 MB。
以上内容由遇见数据集搜集并总结生成



