Crystalcareai/MoD

Name: Crystalcareai/MoD
Creator: Crystalcareai
Published: 2024-03-01 17:16:28
License: 暂无描述

Hugging Face2024-03-01 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Crystalcareai/MoD

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是为了训练Qwen1.5-8x7b模型而创建的，包含了多个来源的数据，如Bagel、OpenHermes等，总计约780,000个不同的ShareGPT对话。数据集的目标是鼓励混合专家模型（MoE）发展其独特的专家。尽管在训练过程中遇到了一些挑战，如CUDA错误，但模型表现出了对数据集的适应性，并在初步推理测试中表现出了与Mixtral相当的性能。

提供机构：

Crystalcareai

原始信息汇总

数据集概述

数据集列表

jsonifize/Tested-188k-Python-Alpaca_stringified-jsonifize
Norquinal/WizardLM_alpaca_claude_evol_instruct_70k
allenai/ai2_arc
Squish42/bluemoon-fandom-1-1-rp-cleaned
google/boolq
LDJnr/Capybara
mattpscott/airoboros-summarization
Locutusque/Hercules-v1.0
lmsys/lmsys-chat-1m
Muennighoff/natural-instructions
HuggingFaceH4/no_robots
grimulkan/PIPPA-augmented-dedup
euclaise/reddit-instruct
teknium/OpenHermes-2.5
ropes
Open-Orca/SlimOrca-Dedup
migtissera/Synthia-v1.3
HuggingFaceH4/ultrachat_200k
winogrande
CollectiveCognition/chats-data-2023-09-22
CollectiveCognition/chats-data-2023-09-27
CollectiveCognition/chats-data-2023-10-16
Locutusque/GPT4-LLM-Cleaned-chatml
Locutusque/GPT4-roleplay-chatml
Locutusque/GPT4-roleplay-v2-chatml
Locutusque/WizardLM_evol_instruct_70k_chatml
Locutusque/camel-chatml
Locutusque/code-assistant-chatml
Locutusque/code-assistant-v2-chatml
Locutusque/dolphin-gpt4-chatml
Locutusque/function-calling-chatml
Locutusque/general-instruct-chatml
Locutusque/lmsys-chat-1m-best
Locutusque/medtext-chatml
Locutusque/metamathqa-chatml
Locutusque/platypus-chatml
Locutusque/pubmedqa-chatml
Locutusque/unnatural-instructions-chatml

许可证

本数据集遵循Apache-2.0许可证。

5,000+

优质数据集

54 个

任务类型

进入经典数据集