zeio/pale
收藏Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeio/pale
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为pale,主要包含从League of Legends游戏中的角色台词,这些台词是从fandom网站解析得到的。数据集提供了多种配置,包括原始数据、去除音效的台词版本、带有标签的扩展版本以及包含音频文件的版本。每个数据实例包含多个字段,如主要类别、次要类别、文本内容、音频链接、角色名称等。
提供机构:
zeio
原始信息汇总
数据集卡片 for pale
数据集描述
数据集摘要
该数据集包含从fandom解析的联盟英雄的引用。数据集有以下配置:
vanilla- 从网站拉取的所有数据,除了网页结构解析外没有重大修改;quotes- 语料库的截断版本,不包含声音效果;annotated- 完整配置的扩展版本,包含几个带有标签的附加列;pulled- 与vanilla相同,但从网站拉取了声音文件,source列被替换为sound。
数据集结构
数据实例
以下是数据集中的一个条目示例:
json { "header": "Attack", "subheader": "Attacking", "text": "Kindred: "The masks of the Kindred seek you!"", "source": "https://static.wikia.nocookie.net/leagueoflegends/images/1/12/Kindred_Original_Passive_Mark_Enemy_6.ogg/revision/latest?cb=20221204121356", "champion": "kindred" }
数据字段
每个数据集条目包含以下字段:
header- 文本的主要类别;subheader- 文本的次要类别(某些情况下没有);text- 冠军所说的文本或冠军发出的声音的描述;source- 音频文件的链接(仅vanilla配置);champion- 冠军名称,小写;quote- 显示相应文本是否包含引用的二进制字段(仅annotated配置);sound- 条目的音频数据(仅pulled配置)。



