five

zeio/pale

收藏
Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeio/pale
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为pale,主要包含从League of Legends游戏中的角色台词,这些台词是从fandom网站解析得到的。数据集提供了多种配置,包括原始数据、去除音效的台词版本、带有标签的扩展版本以及包含音频文件的版本。每个数据实例包含多个字段,如主要类别、次要类别、文本内容、音频链接、角色名称等。
提供机构:
zeio
原始信息汇总

数据集卡片 for pale

数据集描述

数据集摘要

该数据集包含从fandom解析的联盟英雄的引用。数据集有以下配置:

  1. vanilla - 从网站拉取的所有数据,除了网页结构解析外没有重大修改;
  2. quotes - 语料库的截断版本,不包含声音效果;
  3. annotated - 完整配置的扩展版本,包含几个带有标签的附加列;
  4. pulled - 与vanilla相同,但从网站拉取了声音文件,source列被替换为sound

数据集结构

数据实例

以下是数据集中的一个条目示例:

json { "header": "Attack", "subheader": "Attacking", "text": "Kindred: "The masks of the Kindred seek you!"", "source": "https://static.wikia.nocookie.net/leagueoflegends/images/1/12/Kindred_Original_Passive_Mark_Enemy_6.ogg/revision/latest?cb=20221204121356", "champion": "kindred" }

数据字段

每个数据集条目包含以下字段:

  • header - 文本的主要类别;
  • subheader - 文本的次要类别(某些情况下没有);
  • text - 冠军所说的文本或冠军发出的声音的描述;
  • source - 音频文件的链接(仅vanilla配置);
  • champion - 冠军名称,小写;
  • quote - 显示相应文本是否包含引用的二进制字段(仅annotated配置);
  • sound - 条目的音频数据(仅pulled配置)。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作