five

goendalf666/sales-textbook_for_convincing_and_selling

收藏
Hugging Face2023-10-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/goendalf666/sales-textbook_for_convincing_and_selling
下载链接
链接失效反馈
官方服务:
资源简介:
--- task_categories: - text-generation language: - en tags: - sales size_categories: - 100K<n<1M --- # Dataset Card for sales-textbook_for_convincing_and_selling A textbook create for the purpose of training a sales chatbot. Inspiration come from: Textbooks is all you need https://arxiv.org/abs/2306.11644 The data was generated by gpt-3.5-turbo #Structure A simpel textbook that has subheadlines and headlines. Chapters and Subheadlines are mentioned in the dataset. Look at the first two examples. # Data Generation The following code was used for the text generation: #include github link Out of the textbook conversation examples were generated https://huggingface.co/datasets/goendalf666/sales-conversations Here is the prompt that was used for the data generation. For the exact data generation code look up the following repo: #a structure with headlines and subheadlines was generated before https://github.com/tom813/salesGPT_foundation/blob/main/data_generation/textbook_and_conversation_gen.py ``` prompt = f""" I want to write a book about sales and convincing techniques. Here is the outline of the chapters: 1. Building Rapport and Capturing Attention 2. Developing Exceptional Communication Skills 3. Discovering Customer Needs and Pain Points 4. Presenting Solutions and Benefits 5. Overcoming Resistance and Objections 6. Closing the Sale Here is the outline of the current chapter that: {headline} Write me a long and detailed text for the subpoint: {subheadline} of the current chapter and only write a text for this subpoint. Ignore points like body language or tone of voice. Focus on the Start by mentioning the Chapter and the subpoint. The overall aim is to write a textbook. to teach someone with less experience how to convince people and sell stuff. """ ```

任务类别:文本生成 语言:英语 标签:销售 规模类别:10万 < 样本数 < 100万 # 数据集卡片:sales-textbook_for_convincing_and_selling 本数据集为用于训练销售聊天机器人的销售类教材。 其创作灵感源自论文《Textbooks Is All You Need》(https://arxiv.org/abs/2306.11644)。 数据集内容由GPT-3.5-turbo生成。 # 数据集结构 本数据集采用具备章节标题与子标题的简易教材格式,数据集中包含完整的章节与子标题信息,可参考前两条示例。 # 数据生成流程 文本生成所用代码如下:[包含GitHub链接] 基于本教材生成了对话示例数据集,详见:https://huggingface.co/datasets/goendalf666/sales-conversations。 以下为数据生成所用的提示词模板。完整的数据生成代码可查阅下述代码仓库: # 预生成结构文件 此前已先生成包含章节标题与子标题的结构文件,详见:https://github.com/tom813/salesGPT_foundation/blob/main/data_generation/textbook_and_conversation_gen.py prompt = f""" 我计划编写一本关于销售与说服技巧的书籍,以下为全书章节大纲: 1. 建立融洽关系与吸引注意力 2. 锤炼卓越沟通技巧 3. 挖掘客户需求与痛点 4. 呈现解决方案与价值收益 5. 化解抵触情绪与反对意见 6. 促成交易成交 以下为当前章节的大纲: {headline} 请为当前章节的子主题:{subheadline}撰写一篇详实全面的文本,且仅针对该子主题进行创作。 请勿涉及肢体语言、语气语调等内容,请聚焦于。 请在开篇提及当前章节与子主题。 整体创作目标为编写一本教材,用于向经验不足的从业者传授说服他人与产品销售的方法。 """
提供机构:
goendalf666
原始信息汇总

数据集卡片 for sales-textbook_for_convincing_and_selling

概述

  • 任务类别: 文本生成
  • 语言: 英语
  • 标签: 销售
  • 数据集大小: 100K<n<1M

数据集描述

该数据集是为训练销售聊天机器人而创建的教科书。灵感来源于论文《Textbooks is all you need》。数据由gpt-3.5-turbo生成。

结构

教科书包含子标题和主标题,章节和子标题在数据集中提及。

数据生成

数据生成使用了以下代码:

#include github link

从教科书中生成了对话示例,具体数据生成代码可在以下仓库中查看:

https://github.com/tom813/salesGPT_foundation/blob/main/data_generation/textbook_and_conversation_gen.py

提示

用于数据生成的提示如下:

prompt = f""" I want to write a book about sales and convincing techniques. Here is the outline of the chapters:

  1. Building Rapport and Capturing Attention
  2. Developing Exceptional Communication Skills
  3. Discovering Customer Needs and Pain Points
  4. Presenting Solutions and Benefits
  5. Overcoming Resistance and Objections
  6. Closing the Sale

Here is the outline of the current chapter that:
{headline}

Write me a long and detailed text for the subpoint: {subheadline} of the current chapter and only write a text for this subpoint. Ignore points like body language or tone of voice. Focus on the Start by mentioning the Chapter and the subpoint. The overall aim is to write a textbook. to teach someone with less experience how to convince people and sell stuff. """

搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能辅助内容生成领域,该数据集采用了一种结构化的自动构建方法。其核心是基于GPT-3.5-turbo模型,依据预先设定的销售教材大纲进行文本生成。构建过程始于一个涵盖六大核心销售章节的详细提纲,包括建立关系、沟通技巧、需求发现等。生成器针对每个章节下的具体子标题,接收包含章节大纲和当前子标题的特定提示词,进而创作出详尽的教学文本。整个流程旨在模拟教材编写逻辑,确保生成内容聚焦于销售说服技巧的理论阐述,并明确排除了对肢体语言等非文本要素的讨论,从而形成一套体系化的教学材料。
特点
该数据集作为销售领域的专业教学语料,展现出若干鲜明特征。其内容结构严谨,严格遵循传统教科书的章节与子标题编排体系,便于系统化学习与检索。数据规模适中,介于十万到百万条目之间,为模型训练提供了充足的文本资源。语料主题高度聚焦于销售与说服技巧,涵盖了从初步接触到最终成交的全流程知识,具有明确的实用教学导向。文本风格统一,均为由大型语言模型生成的、旨在指导新手的详细说明性文字,确保了内容的一致性与专业性。这些特点共同使其成为训练销售对话机器人的理想知识库。
使用方法
该数据集主要服务于文本生成任务,特别是在构建领域特定的对话系统方面具有直接应用价值。研究人员或开发者可将其作为高质量、结构化的训练数据,用于微调语言模型,以赋予模型专业的销售知识与说服能力。典型的使用路径是结合其衍生的对话数据集,共同训练一个能够进行销售情景对话的智能体。在实际操作中,用户可直接通过Hugging Face平台加载该数据集,并参考其关联的GitHub仓库中提供的详细数据生成代码,以理解数据的内在逻辑并进行后续的预处理或模型训练工作,最终实现销售聊天机器人的开发与优化。
背景与挑战
背景概述
在人工智能与自然语言处理领域,高质量专业文本数据的构建对于推动领域专用模型的发展至关重要。数据集'goendalf666/sales-textbook_for_convincing_and_selling'由独立研究者于2023年创建,其灵感源于'Textbooks is all you need'这一研究理念,旨在通过生成式人工智能技术合成销售领域的教科书式文本。该数据集聚焦于销售说服技巧的核心研究问题,涵盖了建立关系、沟通技能、需求发现、解决方案呈现、异议处理及成交闭合等关键章节,为训练销售对话系统提供了结构化的知识基础,对专业化对话生成模型的进步具有显著推动作用。
当前挑战
该数据集致力于解决销售对话生成这一领域问题,其核心挑战在于如何生成既专业准确又具教学指导性的文本,以模拟真实销售场景中的复杂说服逻辑。在构建过程中,面临多重挑战:一是依赖生成模型GPT-3.5-turbo合成内容,需确保文本在销售专业知识上的可靠性与一致性,避免产生误导性信息;二是数据生成需严格遵循预定义的章节结构,同时忽略如肢体语言等非文本要素,保持内容聚焦,这对提示工程的设计提出了较高要求;三是生成文本需兼具教学性与实用性,以有效训练销售聊天机器人,平衡理论深度与实际应用场景之间的关联。
常用场景
经典使用场景
在销售与说服技术领域,该数据集作为一本由AI生成的教科书,其经典使用场景聚焦于训练销售对话机器人。通过涵盖建立关系、沟通技巧、需求发现、解决方案呈现、异议处理及成交等核心章节,数据集为模型提供了结构化、专业化的知识基础,使其能够模拟真实销售对话中的说服策略与技巧,从而在自动化销售辅助或培训系统中发挥关键作用。
解决学术问题
该数据集解决了自然语言生成与领域知识融合中的关键学术问题,特别是在有限真实数据下构建高质量专业文本的挑战。它通过AI生成方式,为研究文本生成模型在特定垂直领域(如销售)的适应性与可控性提供了基准,有助于探索如何将结构化大纲转化为连贯、详细的教材内容,从而推动领域自适应语言模型的发展,并降低专业数据收集的成本与门槛。
衍生相关工作
该数据集衍生的经典工作包括基于其构建的销售对话生成模型,如结合教科书与对话数据训练的专业聊天机器人。相关研究进一步探索了多轮说服策略的建模、客户情感分析在销售中的应用,以及如何将生成内容与真实销售日志结合以优化性能。这些工作扩展了AI在销售自动化中的边界,并为后续的垂直领域文本生成提供了方法论参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作