five

Open Dataset of Japanese Yokai

收藏
github2025-09-09 更新2025-09-10 收录
下载链接:
https://github.com/glorylab/yokai-jp
下载链接
链接失效反馈
官方服务:
资源简介:
一个实验性的日本妖怪(妖怪)开放数据集,用于文化、教育和创意用途。包含妖怪的名称、别名、读音和地区信息,目前仅提供日语版本,采用CC BY-SA 4.0许可协议

An experimental open dataset of Japanese yōkai for cultural, educational and creative purposes. It includes the names, aliases, pronunciations and regional information of yōkai. Currently only available in Japanese, and licensed under CC BY-SA 4.0.
创建时间:
2025-09-09
原始信息汇总

Open Dataset of Japanese Yokai 数据集概述

数据集简介

  • 名称:Open Dataset of Japanese Yokai
  • 性质:实验性开放数据集
  • 内容:日本妖怪(妖怪)相关数据
  • 用途:文化、教育和创意用途
  • 维护方:YOKAI.JP 团队(日本妖怪文化门户网站)

数据来源

  • 镜像自 https://yokai.jp/yokai 的内容结构和条目
  • 仅用于参考和实验目的

当前状态

  • 语言:仅日语(metadata.language = "ja")
  • 稳定性:不稳定,字段名称、结构、ID和内容可能随时更改
  • 准确性:非学术权威性,可能不完整或简化
  • 对齐性:数据跟踪 yokai.jp/yokai 的内容

数据类型

  • traditional:来自民间传说、古典文本和历史图像的实体
  • daily:由 YOKAI.JP 为现代/互动语境创建的现代妖怪

数据模型

  • 版本:v0.1.0
  • 总物种数:141
  • 总版本数:145
  • 总图像数:156
  • 许可证:CC BY-SA 4.0
  • 源网址:https://yokai.jp
  • GitHub网址:https://github.com/glorylab/yokai-jp

主要字段

  • slug:稳定标识符
  • name:主要日语名称
  • nameKana:读音
  • aliases[]:替代名称
  • category:松散分类
  • yokaiType:传统或原创类型
  • origin:简要来源
  • baseDescription:简短描述(日语)
  • versions[]:变体记录

使用案例

  • 文化/教育应用程序或演示
  • 创意编码和原型设计
  • 语言学习实验
  • 轻量级自然语言处理/民间传说术语分析

许可证信息

  • 类型:Creative Commons Attribution–ShareAlike 4.0 (CC BY-SA 4.0)
  • 要求:需署名并以相同许可证共享
  • 法律文本:https://creativecommons.org/licenses/by-sa/4.0/
  • 署名示例:"Data from YOKAI.JP – Open Dataset of Japanese Yokai (CC BY-SA 4.0)."

未来发展

  • 计划添加英语和其他语言
  • 可能添加源引用(出典)、扩展引用和更丰富的元数据
  • 欢迎贡献:更正、添加、翻译或结构建议

联系方式

  • 咨询:包括商业或合作问题
  • 联系页面:https://yokai.jp/contact
搜集汇总
数据集介绍
main_image_url
构建方式
日本妖怪开放数据集的构建依托于YOKAI.JP文化门户网站的内容体系,采用自动化提取与结构化转换技术,将线上百科全书条目转化为机器可读的JSON格式。数据集严格遵循源网站的更新节奏,通过版本控制机制动态同步新增妖怪条目、图像资源及元数据字段,并采用CC BY-SA 4.0协议保障数据的开放性与可衍生性。
特点
该数据集涵盖传统民俗妖怪与现代创作型妖怪的双重分类体系,每条记录包含日语原名、假名读法、别称、文化分类及来源说明等多维度字段。其独特价值在于融合了历史文献与当代创新内容,既包含来自古典文本的传统妖怪,也收录了平台原创的每日妖怪系列,并通过版本字段记录同一妖怪的不同艺术表现形式。
使用方法
使用者可通过GitHub仓库获取JSON格式的数据文件,利用metadata中的版本标识符追踪更新状态。数据适用于文化教育类应用开发、创意编程原型设计及日语学习辅助工具构建,需遵循CC BY-SA 4.0协议标注来源。对于学术研究场景,建议结合原始网站内容交叉验证以确保准确性。
背景与挑战
背景概述
日本妖怪开放数据集由YOKAI.JP文化门户团队于2025年创建,致力于系统化整理日本传统与现代妖怪文化资料。该数据集涵盖141种妖怪物种、145个版本变体及156幅图像,采用机器可读的JSON格式呈现,支持文化教育、创意编程及轻量化自然语言处理实验。作为非权威性文化资源,其核心价值在于推动民俗文化的数字化传播与跨领域应用,为研究者提供可扩展的文化数据分析基础。
当前挑战
领域挑战集中于妖怪文化的多源性与地域差异性,传统妖怪存在文献记载模糊与版本分歧问题,需解决非结构化民俗知识的标准化表征。构建挑战体现为数据动态迭代的不稳定性,字段结构与内容可能随时变更;当前仅支持日语语料,缺乏多语言扩展与学术级来源标注,限制了跨文化研究的深度。此外,现代原创妖怪与传统体系的融合需平衡文化准确性与创新表达。
常用场景
经典使用场景
在民俗文化与数字人文交叉领域,日本妖怪开放数据集为研究者提供了结构化分析传统妖怪谱系的实验性基础。该数据集常被用于构建妖怪知识图谱,通过语义关联分析不同地域传说中妖怪形象的演变轨迹,并支撑跨媒介的民俗叙事可视化研究。
衍生相关工作
基于该数据集衍生的经典工作包括妖怪主题的跨语言知识图谱构建项目「YokaiNet」,以及结合生成式AI的妖怪形象再创作系统「HyakkiYagyo」。这些成果不仅拓展了计算民俗学的研究边界,更为文化遗产的数字化保存提供了技术范式。
数据集最近研究
最新研究方向
在文化遗产数字化领域,日本妖怪开放数据集正推动跨学科研究的新浪潮。当前研究聚焦于通过自然语言处理技术解析妖怪名称的语义网络,挖掘民俗传说中隐藏的地域文化特征。学者们结合生成式人工智能,探索传统妖怪形象在现代视觉艺术中的创新表达,同时关注多语言版本数据集对跨文化传播的促进作用。该数据集为数字人文研究提供了独特的语料基础,其机器可读特性支持文化元素的量化分析,为非物质文化遗产的活化利用开辟了新路径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作