five

pykeio/vtuber-chats-reprocessed

收藏
Hugging Face2023-06-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/pykeio/vtuber-chats-reprocessed
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: apache-2.0 language: - ja - en - ko - zh - id - tl tags: - livestream - stream pretty_name: VTuber Chats 4.5M size_categories: - 1M<n<10M --- # VTuber Chats (Reprocessed) A dataset of 2,235,416 chat messages collected from various Hololive and Nijisanji YouTube live streams. This dataset is deduplicated and re-run with far more accurate language detection. For the original raw dataset, see [`pykeio/vtuber-chats-4.5m`](https://huggingface.co/datasets/pykeio/vtuber-chats-4.5m).
提供机构:
pykeio
原始信息汇总

VTuber Chats (Reprocessed) 数据集概述

基本信息

  • 许可证: Apache-2.0
  • 语言:
    • 日语 (ja)
    • 英语 (en)
    • 韩语 (ko)
    • 中文 (zh)
    • 印度尼西亚语 (id)
    • 他加禄语 (tl)
  • 标签:
    • 直播 (livestream)
    • 流媒体 (stream)
  • 数据集名称: VTuber Chats 4.5M
  • 大小分类: 1M<n<10M

数据内容

  • 描述: 包含2,235,416条从Hololive和Nijisanji YouTube直播中收集的聊天消息。
  • 处理: 数据集已去重,并使用更精确的语言检测重新处理。
  • 原始数据集: 参考 pykeio/vtuber-chats-4.5m
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作