five

honkai-star-rail

收藏
Hugging Face2024-09-15 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/Bronya-Rand/honkai-star-rail
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是miHoYo Co. Ltd. (CN)/HoYoverse (GLB)开发的'崩坏:星穹铁道'游戏中重要概念、术语、角色、对话等元素的精选集合。它包含诸如Aeons、角色、Curios、敌人、派系、库存物品、路径、可读物、遗物和术语等部分。数据来源于HoYoLab上的'崩坏:星穹铁道'维基,旨在增强AI模型对该游戏宇宙的理解。数据集结构包括页面ID、维基、页面名称、组件名称和对话等字段。它经过精心策划,以避免包含个人信息和敏感信息,并设计为安全、非恶意的使用。

This dataset is a curated collection of core concepts, terminology, characters, dialogues and other key elements from the game *Honkai: Star Rail*, developed by miHoYo Co., Ltd. (CN) / HoYoverse (GLB). It encompasses categories including Aeons, characters, Curios, enemies, factions, inventory items, Paths, readables, relics and specialized terminology. The data is sourced from the Honkai: Star Rail Wiki hosted on HoYoLab, with the goal of enhancing AI models' comprehension of this game's universe. The dataset's structure includes fields such as page ID, wiki source, page name, component name and dialogue. It has been meticulously curated to exclude personal information and sensitive content, and is intended for safe, non-malicious use.
创建时间:
2024-09-07
原始信息汇总

Honkai Star Rail 数据集概述

数据集描述

Honkai Star Rail 数据集是从 miHoYo 的 HoYoLab 官方维基中收集的重要概念、术语、人物、对话等信息,涵盖了 Anime 回合制抽卡游戏 Honkai: Star Rail 的相关内容。数据集包括以下部分:

  • Aeons
  • Characters
  • Curios
  • Enemies
  • Factions
  • Inventory Items
  • Paths
  • Readables
  • Relics
  • Terms

数据集结构

  • "page_id" - HoYoLab 中的页面 ID。
  • "wiki" - 相关维基(Genshin Impact/Honkai: Star Rail)。
  • "page_name" - 页面名称(通常是角色/神/物品等的名称)。
  • "component_name" - 数据来源的内部结构部分。
  • "conversations" - 关于组件内容的处理(或通用)对话。

数据集创建

数据来源

数据来源于 miHoYo Co. Ltd/HoYoverse 和 HoYoLab 编辑者创建的 HoYoLab 维基。

数据收集与处理

  • 选择过程
    1. 维基部分是否有助于理解 Honkai: Star Rail 宇宙的工作原理?
    2. 数据是否对角色知识重要?
    3. 数据是否重要以解释游戏中的特定事物(如 Ena 或 Jarilo-VI 的故事)。
  • 数据清理:使用 BeautifulSoup 和 html_sanitizer 进行自定义 Python 脚本清理。

使用场景

  • 为 AI 模型添加关于 Honkai: Star Rail 及其角色的额外知识。
  • 扩展现有模型对 Honkai: Star Rail 宇宙的知识。
  • 使用更主要的 Honkai: Star Rail 知识来源。

限制与风险

  • 数据集不应带来偏见,但可能存在恶意使用风险,尤其是将 AI 响应视为“真实”或官方内容。
  • 建议在使用时保持常识,不要试图将此数据集的生成内容作为官方 miHoYo 对话。

术语表

  • Aeons - 游戏中指代特定 Path 的个体神。
  • Curios - Herta 和 Herta 空间站上的人发现的“有趣”事物,通常存储在 Herta 的保险库或模拟宇宙/分歧宇宙中。
  • Path - 可能与拥有神或已逝神的团体/俱乐部/宗教混合体相关的术语。
  • Readables - 游戏中的期刊、书籍、信件等。
  • Relics - 指在模拟宇宙、Calyx(地牢)、宝箱等中获得的装备。
搜集汇总
数据集介绍
main_image_url
构建方式
Honkai Star Rail数据集通过从miHoYo的HoYoLab站点抓取Honkai: Star Rail官方维基的条目构建而成。数据收集过程中,使用了自定义的Python脚本结合BeautifulSoup和`html_sanitizer`进行HTML清理和特定数据分析,确保数据的准确性和可读性。数据集涵盖了从HSR 1.0到2.5版本的所有重要条目,排除了与玩家内容无关的部分,专注于游戏世界的核心知识。
使用方法
Honkai Star Rail数据集主要用于增强AI模型对Honkai: Star Rail游戏世界的理解。通过将数据集中的知识整合到现有模型中,可以提升模型对游戏角色、背景故事及游戏机制的理解能力。使用时应遵循常识,避免将AI生成的内容误认为是官方信息。数据集适用于对游戏感兴趣的开发者和研究者,帮助他们构建更智能的游戏相关应用。
背景与挑战
背景概述
Honkai: Star Rail数据集由Bronya-Rand于2023年创建,旨在为人工智能模型提供关于miHoYo公司开发的《崩坏:星穹铁道》游戏的详细信息。该数据集涵盖了从1.0到2.5版本的游戏内容,包括角色、敌人、物品、对话等多个方面,数据来源于HoYoLab官方维基。通过这一数据集,研究人员可以更深入地理解游戏的世界观和角色背景,从而为自然语言处理和对话系统等领域提供支持。该数据集的创建不仅丰富了AI模型对游戏知识的理解,也为游戏社区的AI应用提供了新的可能性。
当前挑战
Honkai: Star Rail数据集在构建过程中面临的主要挑战包括数据的选择与清理。由于数据来源于官方维基,内容庞杂且格式不一,需要通过自定义的Python脚本进行HTML清理和数据解析,以确保数据的可用性和一致性。此外,数据集的使用也面临一定的风险,例如AI模型可能生成与游戏官方设定不符的内容,导致用户误解或过度沉浸于虚拟对话中。因此,如何在保持数据准确性的同时,避免潜在的误导性输出,是该数据集应用中的一大挑战。
常用场景
经典使用场景
在人工智能模型的训练中,Honkai Star Rail数据集被广泛用于增强模型对《崩坏:星穹铁道》游戏世界的理解。通过整合游戏中的角色、对话、背景故事等关键信息,该数据集为AI模型提供了丰富的知识库,使其能够更好地模拟游戏内的互动和对话。
解决学术问题
该数据集解决了在自然语言处理领域中,如何有效整合和利用游戏内复杂背景知识的问题。通过提供结构化的游戏信息,研究人员可以更深入地探索AI在复杂叙事环境中的表现,尤其是在角色对话生成和情境理解方面的应用。
实际应用
在实际应用中,Honkai Star Rail数据集被用于开发智能助手和聊天机器人,这些助手能够与玩家进行基于游戏内容的互动。此外,该数据集还被用于游戏内容的自动生成和个性化推荐系统,提升玩家的游戏体验。
数据集最近研究
最新研究方向
近年来,随着游戏与人工智能技术的深度融合,基于游戏数据的自然语言处理研究逐渐成为热点。Honkai: Star Rail数据集作为一款热门回合制卡牌游戏的官方维基数据集合,为AI模型提供了丰富的游戏世界知识。该数据集涵盖了从角色背景、对话到游戏术语等多维度信息,为AI模型在游戏领域的知识增强提供了重要支持。当前研究主要聚焦于如何利用该数据集优化AI模型的对话生成能力,特别是在角色扮演和沉浸式交互场景中的应用。此外,研究者还探索了如何通过该数据集提升AI对游戏世界观的深度理解,从而为玩家提供更具个性化的游戏体验。这一研究方向不仅推动了游戏AI技术的发展,也为跨领域知识融合提供了新的思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作