LuminaAI/RCL-Customer-Support-Training
收藏Customer Support Chatbot Training Dataset
概述
该数据集包含用于训练聊天机器人和语言模型的客户支持对话。每个样本存储在单独的文本文件中,特征以空格分隔在单行上。该数据集结构化,以便与Lumina AI的随机对比学习(RCL)算法通过PrismRCL应用程序或API兼容。
数据集结构
数据集按以下结构组织:
Customer_Support_Chatbot_Dataset/ train_data/ category_1/ sample_0.txt sample_1.txt ... category_2/ sample_0.txt sample_1.txt ... test_data/ category_1/ sample_0.txt sample_1.txt ... category_2/ sample_0.txt sample_1.txt ...
注意:所有文本文件名在所有类别文件夹中必须是唯一的。
特征
- 表格数据:每个文本文件包含以空格分隔的值,表示样本的特征。
- 类别:有多个类别,每个类别根据客户支持交互的类型由单独的文件夹表示。
使用
以下是使用PrismRCL加载数据集的示例:
bash C:PrismRCLPrismRCL.exe chisquared rclticks=10 boxdown=0 data=C:path oCustomer_Support_Chatbot_Dataset rain_data testdata=C:path oCustomer_Support_Chatbot_Dataset est_data savemodel=C:path omodelsmymodel.classify log=C:path olog_files stopwhendone
许可证
该数据集根据cdla-sharing-1.0许可证授权。有关更多详细信息,请参阅LICENSE文件。
原始来源
该数据集受Hugging Face上提供的“Bitext客户支持LLM聊天机器人训练数据集”启发并改编。您可以在以下链接找到原始数据集:
Bitext customer support LLM chatbot training dataset
如果您在研究或应用程序中使用此数据集,请引用原始来源和此改编版本。
附加信息
数据值已准备好以确保与PrismRCL兼容。截至2.4.0版本,无需进行归一化。



