Locutusque/hercules-v4.0
收藏Hugging Face2024-03-26 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Locutusque/hercules-v4.0
下载链接
链接失效反馈官方服务:
资源简介:
Hercules-v4.0是一个广泛且多样化的数据集,结合了多个领域的数据,旨在为训练人工智能模型提供强大的工具。数据源包括对话、编码示例、科学解释等,来源于多个高质量的数据仓库,每个仓库都在不同知识领域为Hercules-v4.0的鲁棒性做出了贡献。数据集融合了结构化和非结构化文本,包含对话、指导性文本、科学解释、编码任务等。该数据集适用于训练和评估能够处理跨领域复杂任务的AI模型,适合学术界和工业界的研究人员和开发者使用,用于开发高级对话代理、指令跟随模型和知识密集型应用。数据质量较高,但可能存在原始数据源的偏见和某些领域的过度代表。此外,数据集中包含X级内容,用户需自行负责使用合规性。
Hercules-v4.0是一个广泛且多样化的数据集,结合了多个领域的数据,旨在为训练人工智能模型提供强大的工具。数据源包括对话、编码示例、科学解释等,来源于多个高质量的数据仓库,每个仓库都在不同知识领域为Hercules-v4.0的鲁棒性做出了贡献。数据集融合了结构化和非结构化文本,包含对话、指导性文本、科学解释、编码任务等。该数据集适用于训练和评估能够处理跨领域复杂任务的AI模型,适合学术界和工业界的研究人员和开发者使用,用于开发高级对话代理、指令跟随模型和知识密集型应用。数据质量较高,但可能存在原始数据源的偏见和某些领域的过度代表。此外,数据集中包含X级内容,用户需自行负责使用合规性。
提供机构:
Locutusque
原始信息汇总
Hercules-v4.0 数据集概述
数据集描述
Hercules-v4.0 是一个广泛且多样化的数据集,结合了多个领域的数据,用于训练人工智能模型。数据来源包括对话、编程示例、科学解释等,源自多个高质量的存储库。
包含的数据源
OpenOrca/SlimOrcaEvol Instruct 70K & 140Kteknium/GPT4-LLM-Cleanedjondurbin/airoboros-3.2AlekseyKorshuk/camel-chatmlCollectiveCognition/chats-data-2023-09-22- Lmsys chat 1m GPT-4 generations only.
glaiveai/glaive-code-assistantglaiveai/glaive-function-calling-v2garage-bAInd/Open-Platypusmeta-math/MetaMathQAmicrosoft/orca-math-word-problems-200kGPTeacher roleplay datasetsBI55/MedText- Various medical datasets by CogStack
- Unnatural Instructions
abacusai/SystemChatm-a-p/Code-Feedbacktotally-not-an-llm/EverythingLM-data-V3Locutusque/arc-cotFuseAI/FuseChat-MixtureLDJnr/Pure-Doveteknium/trismegistus-projectVezora/Tested-22k-Python-AlpacaCrystalcareai/alpaca-gpt4-COTgrimulkan/theory-of-mindCollectiveCognition/chats-data-2023-09-27CollectiveCognition/chats-data-2023-10-16NobodyExistsOnTheInternet/sharegptPIPPAsablo/oasst2_curated
数据特性
数据集融合了来自多个领域的文本,包括结构化和非结构化数据。内容涵盖对话、指导性文本、科学解释、编程任务等。
预期用途
Hercules-v4.0 适用于训练和评估能够处理多领域复杂任务的AI模型。适合学术界和工业界的研究人员及开发者,用于开发高级对话代理、指令遵循模型和知识密集型应用。
数据质量
数据从信誉良好的来源收集,注重多样性和质量。预期数据相对干净,但某些任务可能需要额外的预处理。
限制与偏见
- 数据集可能包含源自原始数据源的固有偏见。
- 某些领域可能因源数据集的性质而过度代表。
成人内容免责声明
Hercules-v4.0 包含成人内容。用户需确保其使用符合所有适用的法律和规定,数据集维护者不对数据集的滥用负责。
使用协议
使用 Hercules-v4.0 数据集的用户同意:
- 数据集使用风险自负。
- 数据集维护者不对因使用数据集产生的任何损害负责。
- 用户不会因任何索赔、责任、损失或费用而追究数据集维护者的责任。



