kanhatakeyama/AutoMultiTurnByMixtral8x22b
收藏Hugging Face2024-05-22 更新2024-05-25 收录
下载链接:
https://hf-mirror.com/datasets/kanhatakeyama/AutoMultiTurnByMixtral8x22b
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过使用MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF模型从开放数据源自动生成的问答对。初始问题(q1)从多种数据源收集,后续的对话则由Mixtral模型生成。数据源包括oasst2-33k-ja、databricks-dolly-15k-ja、minnade和cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental,每个数据源都有相应的许可证。
该数据集是通过使用MaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUF模型从开放数据源自动生成的问答对。初始问题(q1)从多种数据源收集,后续的对话则由Mixtral模型生成。数据源包括oasst2-33k-ja、databricks-dolly-15k-ja、minnade和cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental,每个数据源都有相应的许可证。
提供机构:
kanhatakeyama
原始信息汇总
自動生成のマルチターンデータセット
概要
- このデータセットは、オープンなデータソースからMaziyarPanahi/Mixtral-8x22B-Instruct-v0.1-GGUFを使用してQ&Aを自動生成したものです。
- 関連コードはこちらです。
- 一部の計算には東京工業大学のスーパーコンピュータTSUBAME4.0を利用しました。
データソース
質問の収集と生成
- 最初の質問(q1)は、種々のデータソースから収集されました。その後のやりとりはすべてMixtralが生成しました。
- 質問文については、元データのライセンスに準拠します。
使用したデータソースとライセンス
- oasst2-33k-ja
- ライセンス: apache 2.0
- databricks-dolly-15k-ja
- ライセンス: cc-by-sa-3.0
- minnade
- ライセンス: CC0
- cyberagent/chatbot-arena-ja-calm2-7b-chat-experimental
- ライセンス: cc-by-4.0



