kanhatakeyama/0719-calm3-22b-random-genre-inst-sft-multiturn-tsub
收藏Hugging Face2024-07-23 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/kanhatakeyama/0719-calm3-22b-random-genre-inst-sft-multiturn-tsub
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过OpenCalm3-22b模型在随机主题上生成的问答对,部分计算使用了东京工业大学的超级计算机TSUBAME4.0。数据以jsonl格式存储,文件大小约为数十GB。由于文件较大,使用datasets库可能只能加载前几GB的数据,建议使用git lfs进行下载。数据集未经过清洗,可能包含一些不合理的指令。问答对的生成方式导致Q2不参考Q1和A1,因此问答可能显得有些不连贯。
This is a Q&A dataset generated by the OpenCalm3-22b model, covering random topics. The data is stored in jsonl format, with files approximately tens of GB in size, and has not been cleaned, potentially containing some unreasonable instructions. Due to the specific nature of the generation method, the Q&A may be somewhat disjointed.
提供机构:
kanhatakeyama



