ancss/QSJ_dataset
收藏Hugging Face2023-09-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ancss/QSJ_dataset
下载链接
链接失效反馈官方服务:
资源简介:
枪神纪吧20年以来的数据由chatgpt3.5生成,并由人工从20万条精简到5万条,预计还可以精简到3万条,但懒得看了。ernie_dataset.jsonl 是文心一言 含排序的数据集,计算问题相似性 阈值0.7,相似的问题进行组合。
提供机构:
ancss
原始信息汇总
数据集概述
数据来源
- 数据集内容由chatgpt3.5生成。
- 原始数据从20万条精简至5万条。
数据文件
- 数据集文件名为
ernie_dataset.jsonl。
数据处理
- 数据集用于计算问题相似性,阈值设定为0.7。
- 相似的问题会被组合在一起。



