InnerI/InnerIGPT-0125-1000

Name: InnerI/InnerIGPT-0125-1000
Creator: InnerI
Published: 2024-03-03 19:23:17
License: 暂无描述

Hugging Face2024-03-03 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/InnerI/InnerIGPT-0125-1000

下载链接

链接失效反馈

官方服务：

资源简介：

InnerIGPT-1000-0125数据集是一个包含1000个模拟聊天完成示例的文本数据集，旨在用于微调GPT-3.5-turbo-0125模型，以提升其在聊天完成任务中的表现。数据集涵盖了多样化的对话上下文和主题，每个数据条目包含角色（用户或AI）和内容（用户或AI的文本响应）两个字段。数据收集过程结合了自动化脚本和手动策划，以确保对话主题和风格的广泛代表性，并遵循伦理指南以避免包含有害或偏见内容。数据集经过多轮质量检查，包括手动审查和自动验证，以确保聊天完成的准确性、连贯性和相关性。

提供机构：

InnerI

原始信息汇总

数据集详情

模型信息

模型名称: Chat-Completion Training Dataset for GPT-3.5-turbo-0125
模型版本: 1.0
模型日期: 2024年3月2日
模型开发者: Inner I Network

预期用途

主要用途: 用于微调GPT-3.5-turbo-0125模型，以提升其在聊天完成任务中的性能。
主要用户: 从事AI语言模型研究与开发的科研人员和开发者，特别是专注于聊天机器人应用和对话式AI的领域。
超出范围的用途: 不适用于高风险决策场景或需要数据集中未涵盖的特定领域知识的场景。

数据集详情

数据集类型: 文本
数据集来源: 数据集包含模拟的聊天完成示例，旨在代表多样化的对话上下文和主题。
示例数量: 1000

数据字段

角色: 指示文本是来自用户还是AI。
内容: 包含用户或AI响应的文本内容。

数据收集过程

数据收集方法: 数据通过自动化脚本和人工筛选相结合的方式生成，以确保对话主题和风格的广泛代表性。
数据收集指南: 收集过程遵循伦理指南，避免包含有害或偏见内容。所有数据经过审查和匿名化处理，以移除个人识别信息。

数据质量

数据质量保证措施: 数据集经过多轮质量检查，包括人工审查和自动化验证，以确保聊天完成的准确性、连贯性和相关性。
已知限制: 尽管努力确保多样性和代表性，数据集仍可能包含偏见或未能完全捕捉人类对话的复杂性。

数据集许可

许可证: Apache 2.0

附加信息

引用: 请按以下方式引用此数据集: [InnerIGPT-1000-0125dataset]
联系信息: 如有任何关于数据集的问题或反馈，请联系[@innerinetco]。

5,000+

优质数据集

54 个

任务类型

进入经典数据集