five

cilyy/Anime_subtitles_CN

收藏
Hugging Face2024-06-30 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/cilyy/Anime_subtitles_CN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含一个名为anime_subtitles.csv的文件,文件包含两个特征(name和caption)和4055行数据,大小约为400MB。每个name代表一个季节或电影,caption包含所有角色的对话,但没有角色名称或其他信息。大多数名称和对话是简体中文。数据集可用于文本到文本生成和所有NLP项目,特别是动漫领域。

This dataset contains a CSV file about anime subtitles crawled from the open web, suitable for all NLP projects, especially in the anime domain. The CSV file includes two features (name and caption) with 4055 rows, approximately 400MB in size. Each name represents one season or movie, and caption contains all the dialogues spoken by the characters without including their names or other details. Most of the names and captions are in simplified Chinese.
提供机构:
cilyy
原始信息汇总

数据集卡片:Dataset Name

数据集描述

  • 文件名: anime_subtitles.csv
  • 大小: 约400MB
  • 行数: 4055行
  • 特征:
    • name: 代表一个季度或电影
    • caption: 包含角色对话,无角色名或其他内容
  • 语言: 大部分为简体中文

用途

  • 适用于文本到文本生成文本生成任务
  • 特别适用于动漫领域的自然语言处理项目
  • 该数据集为第一部分,可能会有第二部分
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作