tl-test-learn-prompts

Hugging Face2024-12-03 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/reddgr/tl-test-learn-prompts

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含手动标注的示例，用于训练和测试一个名为[reddgr/tl-test-learn-prompt-classifier](https://huggingface.co/reddgr/tl-test-learn-prompt-classifier)的模型，该模型是DistilBERT的微调版本，用于将聊天机器人提示分类为'test'或'learn'。提示被标记为'test'（1）的情况包括用户提出需要复杂推理或算术逻辑解决的问题，故意用复杂问题挑战对话工具，应用提示工程技术如'思维链'或角色扮演，或提出高度主观的问题以测试工具而非学习。标记为'instruction'（0）的提示包含用户期望从中学习或获取有价值/实用信息的直接问题或请求。数据集还包含一些手动标记的编程示例，通常标记为'learn'，因为语言模型经常将常规编程请求和问题误认为算术问题。

创建时间：

2024-11-21

原始信息汇总

TL (Test vs Learn) chatbot prompts 数据集概述

基本信息

语言: 英语
许可证: Apache 2.0
大小类别: n<1K
任务类别: 文本分类
数据集名称: TL (Test vs Learn) chatbot prompts

数据集结构

特征

text: 字符串类型
label: 分类标签
- class_label:
  - names:
    - 0: learn
    - 1: test

数据分割

train:
- num_bytes: 39320
- num_examples: 293
test:
- num_bytes: 28313
- num_examples: 262

数据大小

download_size: 45776
dataset_size: 67633

配置

config_name: default
- data_files:
  - train: data/train-*
  - test: data/test-*

标签定义

LABEL_0: Learn (instruction)
LABEL_1: Test (problem)

数据集用途

用于训练和测试 reddgr/tl-test-learn-prompt-classifier 模型，该模型是一个基于 DistilBERT 的微调模型，用于将聊天机器人提示分类为 test 或 learn。

标签解释

test: 用户提出需要复杂推理或算术逻辑解决的问题，或有意挑战对话工具的复杂问题，应用提示工程技术，或提出高度主观的问题以测试工具而非学习。
learn: 包含直接的问题或请求，用户期望从交互中学习或获取有价值/实用的信息。

其他信息

该数据集和模型是项目的一部分，旨在识别定量测量大型语言模型（LLMs）生成的文本对话质量的指标。
相关 Jupyter 笔记本和 Python 脚本可在 reddgr/chatbot-response-scoring-scbn-rqtl 仓库中找到。

搜集汇总

数据集介绍

构建方式

该数据集通过人工标注的方式构建，旨在为训练和测试[reddgr/tl-test-learn-prompt-classifier](https://huggingface.co/reddgr/tl-test-learn-prompt-classifier)模型提供数据支持。数据集中的每个样本包含一段聊天机器人提示文本及其对应的标签，标签分为'learn'和'test'两类。标注过程依据用户提示的意图进行分类，其中'test'类提示通常涉及复杂推理、挑战性问题或主观测试，而'learn'类提示则包含用户期望从中学习或获取实用信息的直接问题或请求。

特点

该数据集的主要特点在于其精细的分类体系和明确的应用场景。数据集通过区分用户提示的意图，将聊天机器人提示分为'learn'和'test'两类，这种分类方式有助于模型更准确地理解和响应用户的不同需求。此外，数据集还包含一些手动标注的编程相关示例，这些示例通常被归类为'learn'，以避免模型将其误判为复杂的算术问题。

使用方法

该数据集适用于训练和评估文本分类模型，特别是用于区分聊天机器人提示的意图。用户可以通过加载数据集的训练和测试分割来训练模型，并使用预定义的标签'learn'和'test'进行分类任务。数据集的GitHub仓库中提供了相关的Jupyter笔记本和Python脚本，用户可以利用这些资源进行进一步的分析和模型开发，以提升聊天机器人对话质量的评估能力。

背景与挑战

背景概述

tl-test-learn-prompts数据集由reddgr团队创建，旨在支持大型语言模型（LLMs）在聊天机器人对话质量评估中的应用。该数据集的核心研究问题在于区分用户输入的聊天提示是旨在学习（learn）还是测试（test）聊天机器人。具体而言，'learn'类提示通常涉及用户期望获取实用信息或学习新知识，而'test'类提示则涉及用户提出复杂问题或使用高级提示工程技术来挑战聊天机器人。该数据集的创建不仅为聊天机器人响应质量的量化评估提供了基础，还为相关领域的研究提供了宝贵的资源。

当前挑战

tl-test-learn-prompts数据集在构建过程中面临多项挑战。首先，准确区分'learn'和'test'类提示需要精细的标注策略，尤其是对于涉及编程语言语法的问题，这些通常难以归类。其次，数据集的规模较小（n<1K），可能限制其在复杂模型训练中的应用效果。此外，如何确保标注的一致性和准确性，尤其是在处理高度主观或复杂的问题时，是该数据集面临的另一大挑战。这些挑战不仅影响了数据集的实用性，也对相关模型的性能提出了更高的要求。

常用场景

经典使用场景

在自然语言处理领域，tl-test-learn-prompts数据集的经典使用场景主要集中在对话系统的提示分类任务中。该数据集通过标注聊天机器人的提示为‘学习’或‘测试’，帮助模型区分用户意图是获取知识还是进行复杂问题的测试。这种分类对于优化对话系统的响应策略至关重要，尤其是在处理复杂推理或主观性问题时。

解决学术问题

tl-test-learn-prompts数据集解决了自然语言处理中对话系统意图识别的学术问题。通过明确区分用户是寻求知识还是进行测试，该数据集为研究者提供了一个标准化的评估工具，有助于提升对话系统的交互质量和用户满意度。此外，该数据集还为大规模语言模型（LLMs）的对话生成质量提供了量化指标，推动了相关领域的研究进展。

衍生相关工作

基于tl-test-learn-prompts数据集，研究者们开发了多种相关的经典工作。例如，reddgr/tl-test-learn-prompt-classifier模型通过微调DistilBERT，实现了对聊天机器人提示的高效分类。此外，该数据集还被用于开发对话质量评估的量化指标，推动了大规模语言模型在对话生成领域的应用研究。相关的工作和代码可以在reddgr/chatbot-response-scoring-scbn-rqtl GitHub仓库中找到。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集