five

ZZZDialog

收藏
github2024-07-12 更新2024-07-28 收录
下载链接:
https://github.com/mrzjy/ZZZDialog
下载链接
链接失效反馈
官方服务:
资源简介:
本项目抽取绝区零的文本对话语料,包括绳网的博客与评论以及角色信息。

This project extracts textual dialogue corpora from Zenless Zone Zero, including blog posts and comments from the Hollow Web, as well as character information.
创建时间:
2024-07-11
原始信息汇总

ZZZDialog 数据集概述

数据集描述

ZZZDialog 项目旨在抽取绝区零的文本对话语料。

当前状态

等待恢复包含角色和内容的对话。

支持的功能

  • [x] 抽取绳网的博客与评论
  • [x] 抽取角色信息
  • [ ] 抽取对话

示例

绳网博客与评论(中文)

json { "id": "1007", "poster": "CHAR", "title": "[委托]幽灵列车真的存在!", "text": "我看见 亲眼看见 真的是列车员 在那里 然后又不在了!! 等等,等等等等…我重新组织一下语言,打字的手还在抖… 就在刚才,我和朋友聚餐回来,这个点街上几乎没有人了。拐进锦鲤面馆对面那条小路的时候路灯突然暗了,我以为是灯坏了就没在意。继续往前走了没几步,身后坏掉的路灯突然又亮了起来,回头一看灯下站着一个大活人! 一开始我没反应过来,看到他手上攥着的破车票时我才想起来。这家伙的脸我有印象,是上个月新闻报道里殉职的列车驾驶员! 我头也不回一口气跑回了家,从阳台上望去那个路灯下的人也不见了。不会是我聚餐喝多产生幻觉了吧,可我喝的是乌龙茶啊…", "script": null, "comments": [ { "role": "下辈子我要当只猫", "content": "哦那个列车失事的新闻我记得,据说是一列末班车后的空车,只有驾驶员在车上。因为突发的空洞没来得及撤离,就和车厢一起永远困在克里特空洞里了。" }, { "role": "有那味儿了", "content": "我还听说过一个幽灵列车Plus版本,说至今列车还在空洞里行驶,只不过乘客都是在空洞里遭遇事故的人们。 列车员会出现在午夜的街道上,如果接受他的邀请登上幽灵列车,就能见到死去的亲人…" }, { "role": "RON", "content": "补充一个PlusProMax版本,如果看到幽灵列车员不要慌张,对他说出特定的暗语,他就会把手里的车票递给你哦。" }, { "role": "想在空洞开食堂", "content": "明明只是个怪谈灌水帖,被你们越编越详细。 这下我开始担心有人真的会傻呵呵地去六分街通宵蹲守了。" } ], "player_reply": [ "特定的暗语是什么?", "3楼别卖关子了。" ] }

角色信息(日文)

json { "Partner_Name_1021": "猫宮又奈", "Avatar_Female_Size01_Tsubaki": "猫又", "Partner_OutlookDesc_1021": "新エリー都・市民認証ファイルの記録: ホロウ調査員-猫又。エーテル適性は優秀、都内の既知ホロウ(共生ホロウを含む)にて調査採掘等の基本業務に従事することを許可。

備考:シリオンは人間に比べ、ホロウの環境に適応する能力が高い。ただしシリオンは新陳代謝も人類より活発なため、ひとたび侵蝕を受ければ人類より速く異化されてしまう。同様の理由で、ホロウの環境から離脱後に侵蝕症状が解消されていくのも速い。", "Partner_Gender_02": "女性", "Partner_Race_01": "邪兎屋", "Partner_Stature_02": "148", "Partner_Birthday_02": "7月30日", "Partner_ProfileDesc_1021": "猫宮又奈、普段は自らを「猫又」と呼んでいます。 ネコのシリオンである彼女はネコ科動物の特性を持ち合わせており、 狩猟態勢に入ると凄まじい俊敏さを発揮するほか、 外の世界に対して過剰ともいえる好奇心を持ちます。 大抵は、ちょっとした出来心で無害ないたずらをする程度ですが、彼女が「獲物」を狙うとき、 ネコ科動物生来の恐るべき行動力と集中力を目の当たりにするでしょう。 今一番興味があるのは「他人の財布」とのことです。 アドバイス:猫又と一緒にいる時は、財布から目を離さないことを。

猫又はかつて新エリー都の古参ギャング「赤牙組」に属しており、幼い頃から そのボス「シルバーヘッド」ミゲルには、まるで娘同然に可愛がられていました。 しかし後に赤牙組との間に理念の相違が生まれ、 組織を離れた彼女は一人放浪することになりました。 やがてニコたちと共にいくつかの事件を経た後、邪兎屋への加入を決意し、 邪兎屋の従業員第三号となって今に至ります。", "Partner_Impression_f_1021": "ネコちゃん!猫が嫌いな人なんていないよね! はぁ、猫又のしっぽをモフりたい…だって2本もあるんだよ! 幸せも2倍なんだから!", "Partner_Impression_m_1021": "落ち着いて。新エリー都のそこらにいるような、 無邪気でかわいい猫たちとは違うんだから… 彼女の相手をするとき最も重要なのは、自分の財布を死守することだ。", "PartnerBg_CampGentleHouse": "GENTLE HOUSE ", "Avatar_Female_Size01_Tsubaki_En": "Nekomata", "nickname": "Nekomiya" }

使用步骤

  1. 克隆 Dims ZenlessData 仓库。
  2. 克隆本项目并进入项目目录。
  3. 通过指定 Dims ZenlessData 路径和语言选项运行抽取代码。
  4. 进入数据文件夹查看完整结果。

cmd python extract_interknot_post_comment.py --repo=path/to/ZenlessData --lang=

注意

  • 语言选项:根据 Zenless/TextMap 文件名,例如 CHT, KO, JA, EN 等。默认情况下,"" 为 CHS。
  • 本项目数据文件夹中的文件可能不完整,需要自行运行命令获取完整内容。
搜集汇总
数据集介绍
main_image_url
构建方式
ZZZDialog数据集通过从绝区零(ZenlessZoneZero)中抽取文本对话语料构建而成。该数据集的构建过程主要包括从绳网(Interknot)中提取博客和评论,以及从游戏中提取角色的简单信息。具体步骤包括克隆Dim's ZenlessData仓库,运行提取代码,并指定Zenless数据路径和语言选项。通过这种方式,数据集能够系统地收集和整理游戏中的对话内容,为后续研究提供丰富的语料资源。
使用方法
使用ZZZDialog数据集时,用户首先需要克隆相关仓库并运行提取代码,指定所需的语言选项和数据路径。随后,用户可以在数据文件夹中查看完整的提取结果。数据集的结构清晰,包含博客、评论、角色信息等多个部分,用户可以根据研究需求选择相应的数据进行分析。此外,数据集还提供了详细的FAQ和相关资源链接,方便用户进一步探索和使用。
背景与挑战
背景概述
ZZZDialog数据集是由一个专注于提取ZenlessZoneZero文本对话语料的项目创建的。该项目的主要目标是收集和整理游戏中的对话内容,以便于进一步的分析和研究。创建时间虽未明确提及,但通过其GitHub页面可以推测其活跃于近期。该项目由匿名或未公开的研究人员或机构主导,其核心研究问题在于如何有效地从游戏中提取并结构化对话数据,这对于游戏文本分析、角色研究以及自然语言处理等领域具有重要意义。
当前挑战
ZZZDialog数据集面临的挑战主要集中在数据提取和结构化过程中。首先,提取对话内容本身就是一个复杂的过程,尤其是当对话涉及多个角色和复杂的情节时。其次,数据集的构建过程中需要处理多语言文本,这增加了数据处理的难度和复杂性。此外,数据集的完整性也是一个挑战,因为当前状态显示对话内容的提取尚未完全实现,需要进一步的技术和方法来恢复和完善。
常用场景
经典使用场景
ZZZDialog数据集在自然语言处理领域中,主要用于对话系统的训练与评估。其丰富的对话语料,特别是包含角色、内容和上下文的对话片段,为研究者提供了宝贵的资源。这些对话数据可以用于构建和优化对话模型,提升其在多轮对话中的表现,尤其是在角色扮演和情感交流方面。
解决学术问题
ZZZDialog数据集解决了对话系统研究中常见的语料稀缺问题,为学术界提供了丰富的对话样本。通过分析这些对话,研究者可以深入探讨对话生成、情感识别和角色建模等关键问题。此外,该数据集还促进了跨文化对话系统的研究,通过多语言支持,揭示了不同文化背景下对话模式的差异与共性。
实际应用
在实际应用中,ZZZDialog数据集被广泛用于开发智能客服、虚拟助手和游戏内对话系统。这些系统需要处理复杂的对话场景,包括角色扮演、情感交流和多轮对话。通过利用ZZZDialog的数据,开发者能够训练出更加自然、流畅且具有情感识别能力的对话系统,从而提升用户体验。
数据集最近研究
最新研究方向
在游戏文本分析领域,ZZZDialog数据集的最新研究方向主要集中在对话语料的深度挖掘与情感分析上。通过提取绝区零游戏中的对话内容,研究者们致力于解析角色间的互动模式,进而揭示游戏叙事结构与玩家情感体验的关联。此外,该数据集还为跨文化交流研究提供了丰富的语料,尤其是在多语言支持的背景下,探讨不同文化背景下玩家对游戏内容的理解与反应。这些研究不仅有助于提升游戏设计的精细化水平,也为跨文化心理学和语言学研究提供了新的视角。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作