kanhatakeyama/0717-calm3-22b-random-genre-inst-sft-tsub
收藏Hugging Face2024-07-23 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/kanhatakeyama/0717-calm3-22b-random-genre-inst-sft-tsub
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过OpenCalm3-22b模型生成的,涉及随机主题的问答对。数据以jsonl格式存储,文件大小约为数十GB,且未经过清洗,可能包含一些不合理的指令。部分计算使用了东京工业大学的超级计算机TSUBAME4.0。
The dataset consists of Q&A generated by the OpenCalm3-22b model on random topics. Some calculations were performed using the TSUBAME4.0 supercomputer at Tokyo Institute of Technology. The data is stored in jsonl format, with files totaling around tens of GB, and has not been cleaned, potentially containing some abnormal instructions.
提供机构:
kanhatakeyama
原始信息汇总
自動生成Q&A
数据集描述
- 该数据集包含基于OpenCalm3-22b模型生成的随机主题的问答对。
- 部分计算使用了东京工业大学的超级计算机TSUBAME4.0。
数据格式与大小
- 数据以jsonl格式存储,文件大小约为数十GB。
- 数据集可能需要通过git lfs等方式下载,因为datasets库可能只能加载前几GB的数据。
数据质量
- 数据未经清洗,可能包含一定数量的异常指令。



