five

zeio/auto-pale

收藏
Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeio/auto-pale
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为pale,主要包含从League of Legends游戏中的角色台词,这些台词是从fandom网站解析得到的。数据集提供了四种不同的配置:vanilla、quotes、annotated和pulled,每种配置在数据内容和结构上有所不同。数据集的主要字段包括header、subheader、text、source、champion、quote和sound,分别表示文本的主要类别、次要类别、角色台词或声音描述、音频文件链接、角色名称、是否包含台词的二进制字段以及音频数据。
提供机构:
zeio
原始信息汇总

数据集概述

数据集描述

数据集摘要

该数据集包含从fandom解析的联盟英雄的引用。数据集提供以下配置:

  1. vanilla - 从网站拉取的所有数据,除了网页结构解析外没有重大修改;
  2. quotes - 语料库的截断版本,不包含音效;
  3. annotated - 完整配置的扩展版本,包含几个带有标签的额外列;
  4. pulled - 与vanilla相同,但从网站拉取了音效文件,source列被替换为sound

数据集结构

数据实例

数据集中的一个条目示例如下:

json { "header": "Attack", "subheader": "Attacking", "text": "Kindred: "The masks of the Kindred seek you!"", "source": "https://static.wikia.nocookie.net/leagueoflegends/images/1/12/Kindred_Original_Passive_Mark_Enemy_6.ogg/revision/latest?cb=20221204121356", "champion": "kindred" }

数据字段

每个数据集条目包含以下字段:

  • header - 文本的主要类别;
  • subheader - 文本的次要类别(某些情况下没有);
  • text - 英雄所说的文本或英雄发出的声音描述;
  • source - 音频文件的链接(仅vanilla配置);
  • champion - 英雄名称,小写;
  • quote - 显示相应文本是否包含引用的二进制字段(仅annotated配置);
  • sound - 条目的音频数据(仅pulled配置)。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作