pykeio/vtuber-chats-reprocessed
收藏Hugging Face2023-06-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pykeio/vtuber-chats-reprocessed
下载链接
链接失效反馈官方服务:
资源简介:
---
license: apache-2.0
language:
- ja
- en
- ko
- zh
- id
- tl
tags:
- livestream
- stream
pretty_name: VTuber Chats 4.5M
size_categories:
- 1M<n<10M
---
# VTuber Chats (Reprocessed)
A dataset of 2,235,416 chat messages collected from various Hololive and Nijisanji YouTube live streams.
This dataset is deduplicated and re-run with far more accurate language detection. For the original raw dataset, see [`pykeio/vtuber-chats-4.5m`](https://huggingface.co/datasets/pykeio/vtuber-chats-4.5m).
提供机构:
pykeio
原始信息汇总
VTuber Chats (Reprocessed) 数据集概述
基本信息
- 许可证: Apache-2.0
- 语言:
- 日语 (ja)
- 英语 (en)
- 韩语 (ko)
- 中文 (zh)
- 印度尼西亚语 (id)
- 他加禄语 (tl)
- 标签:
- 直播 (livestream)
- 流媒体 (stream)
- 数据集名称: VTuber Chats 4.5M
- 大小分类: 1M<n<10M
数据内容
- 描述: 包含2,235,416条从Hololive和Nijisanji YouTube直播中收集的聊天消息。
- 处理: 数据集已去重,并使用更精确的语言检测重新处理。
- 原始数据集: 参考
pykeio/vtuber-chats-4.5m
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



