zeio/auto-pale
收藏Hugging Face2023-10-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeio/auto-pale
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为pale,主要包含从League of Legends游戏中的角色台词,这些台词是从fandom网站解析得到的。数据集提供了四种不同的配置:vanilla、quotes、annotated和pulled,每种配置在数据内容和结构上有所不同。数据集的主要字段包括header、subheader、text、source、champion、quote和sound,分别表示文本的主要类别、次要类别、角色台词或声音描述、音频文件链接、角色名称、是否包含台词的二进制字段以及音频数据。
提供机构:
zeio
原始信息汇总
数据集概述
数据集描述
数据集摘要
该数据集包含从fandom解析的联盟英雄的引用。数据集提供以下配置:
vanilla- 从网站拉取的所有数据,除了网页结构解析外没有重大修改;quotes- 语料库的截断版本,不包含音效;annotated- 完整配置的扩展版本,包含几个带有标签的额外列;pulled- 与vanilla相同,但从网站拉取了音效文件,source列被替换为sound。
数据集结构
数据实例
数据集中的一个条目示例如下:
json { "header": "Attack", "subheader": "Attacking", "text": "Kindred: "The masks of the Kindred seek you!"", "source": "https://static.wikia.nocookie.net/leagueoflegends/images/1/12/Kindred_Original_Passive_Mark_Enemy_6.ogg/revision/latest?cb=20221204121356", "champion": "kindred" }
数据字段
每个数据集条目包含以下字段:
header- 文本的主要类别;subheader- 文本的次要类别(某些情况下没有);text- 英雄所说的文本或英雄发出的声音描述;source- 音频文件的链接(仅vanilla配置);champion- 英雄名称,小写;quote- 显示相应文本是否包含引用的二进制字段(仅annotated配置);sound- 条目的音频数据(仅pulled配置)。



