joujiboi/japanese-knowledge-base
收藏Japanese Knowledge Base
概述
JKB(Japanese Knowledge Base)是一个关于日语的问答数据集,目前仍在开发中。该数据集旨在为大型语言模型提供训练数据,以便更好地回答关于日语的问题,特别是针对日语学习者。
数据集内容
数据集包含以下主题:
- N5至N1级别的语法
- 结构和词序
- 书写系统
- 词类
- 助词及其常见混淆的助词
- 活用
- 动词及其类型
- 形容词及其类型
- 敬语
- 姓名后缀
数据集不包含的内容
- 翻译
- 词汇定义
- 句子细微差别
示例
-
问题:〜たり〜たり的常见使用场景是什么? 答案:〜たり〜たり结构用于列举各种可能性的行动示例。它通常用于描述日常活动或计划。例如,可以用它来描述某人在休息日通常做什么或计划在假期做什么。
-
问题:如何使用思う与な形容词? 答案:对于な形容词,可以在其普通形式后附加だ,然后加上と思う。例如,如果你认为某人很幸福,你可以说“幸せだと思います”。
-
问题:如何使用と思う与い形容词? 答案:要使用〜と思う与い形容词,只需在い形容词的普通形式后附加と思う。例如,如果你认为某物很热(熱い),你可以说“熱いと思う”。
-
问题:是否可以在问题中使用〜たい? 答案:是的,你可以使用〜たい来询问某人的愿望或希望,但在与上级或长辈使用时要小心,因为它可能被认为是不礼貌的。
引用
该数据集使用Creative Commons Attribution Non Commercial 4.0许可证,这意味着您可以在非商业用途下使用该数据集,并且必须给予署名。
@misc{Japanese Knowledge Base, title = {Japanese Knowledge Base: A question and answer dataset on the Japanese language}, author = {JawGBoi}, year = {2023}, publisher = {HuggingFace}, journal = {HuggingFace repository}, howpublished = {url{https://huggingface.co/datasets/joujiboi/japanese-knowledge-base}}, }



