five

mydroidandi/commbase-log-chats

收藏
Hugging Face2024-06-29 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/mydroidandi/commbase-log-chats
下载链接
链接失效反馈
官方服务:
资源简介:
Commbase Log Chats数据集包含一系列助手(Eva AI)与最终用户之间的聊天日志。该数据集以文本交换的形式记录了交互,并附带了元数据,如时间戳、消息来源、严重级别和说话者详细信息。该数据集可用于自然语言处理(NLP)、对话AI和聊天分析等应用。
提供机构:
mydroidandi
原始信息汇总

Commbase Log Chats Dataset

数据集描述

Commbase Log Chats Dataset 包含了一系列助手(Eva AI)与终端用户之间的聊天日志。该数据集以文本交流的形式捕捉了交互,并附带了时间戳、消息来源、严重级别和说话者详情等元数据。此数据集可用于自然语言处理(NLP)、对话式AI和聊天分析等多种应用。

数据集结构

数据集以JSON格式存储,每个聊天日志条目包含以下字段:

  • content: 日志条目的完整内容,包括时间戳、来源、严重级别、说话者和文本的组合字符串。
  • timestamp: 消息记录的日期和时间。
  • origin: 消息的来源(例如,app, stt-whisper-proactive)。
  • severity: 消息的严重级别(例如,DEBUG)。
  • speaker: 说话的实体(例如,ASSISTANT, END USER)。
  • text: 消息的实际文本。
  • id: 每个日志条目的唯一标识符。

示例条目

json { "content": "timestamp: 2024-06-09 21:15:39 origin: app severity: DEBUG speaker: ASSISTANT: Mute the microphone to pause recording.", "timestamp": "2024-06-09 21:15:39", "origin": "app", "severity": "DEBUG", "speaker": "ASSISTANT", "text": "Mute the microphone to pause recording.", "id": 1 }

使用方法

可以使用Hugging Face的datasets库加载数据集。以下是如何在Python中加载和使用数据集的示例:

python from datasets import load_dataset

从Hugging Face加载数据集

dataset = load_dataset("mydroidandi/commbase-log-chats")

显示前几个条目

print(dataset[train][:5])

许可证

Apache-2.0.

引用

如果您在工作中使用了此数据集,请按以下方式引用:

bibtext @dataset{mydroidandi_commbase_log_chats, author = {Esteban Herrera}, title = {Commbase Log Chats Dataset}, year = {2024}, url = {https://huggingface.co/datasets/mydroidandi/commbase-log-chats}, }

联系

如有任何关于数据集的问题或疑问,请联系:

  • 姓名:Esteban Herrera Castro
  • 邮箱:stv.herrera@gmail.com
  • GitHub:https://github.com/estebanways
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作