p1atdev/modern_haiku
收藏现代俳句数据集
数据集概述
现代俳句数据集是从现代俳句协会的数据库中收集的俳句数据集。
数据集结构
数据实例
全部数据
数据集包含以下字段:
id: 俳句的ID号。haiku: 俳句的文本。author: 俳句的作者姓名。foreword: 未知。可为空。source: 俳句的来源文档名称。可为空。comment: 由reviewer对俳句的评论。可为空。reviewer: 做出评论的审阅者姓名。可为空。note: 关于俳句的备注。可为空。season: 俳句的季节。如果俳句没有季节词,则为none。kigo: 俳句中的季节词,如果有的话。id: 词的ID号。word: 季节词。kana: 词的发音。old_kana: 词在旧平假名版本中的发音。可为空。season: 词的季节。subtitle: 词的其他名称。
数据集示例: json { "id":1, "haiku":"朝霧の中に九段のともし哉", "author":"正岡子規", "foreword":null, "source":"寒山落木", "comment":null, "reviewer":null, "note":null, "season":"autumn", "kigo":{ "id":1418, "word":"霧", "kana":"きり", "old_kana":null, "season":"autumn", "subtitle":[ "朝霧", "夕霧", ... ] } }
季节子集
数据集还包括以下季节子集:
spring: 包含春季季节词的俳句。summer: 包含夏季季节词的俳句。autumn: 包含秋季季节词的俳句。winter: 包含冬季季节词的俳句。none: 不包含季节词的俳句。
冬季子集示例: json { "id":528, "haiku":"磯鷲はかならず巌にとまりけり", "author":"原石鼎", "foreword":null, "source":"花影", "comment":null, "reviewer":null, "note":null, "kigo":{ "id":2265, "word":"鷲", "kana":"わし", "old_kana":null, "season":"winter", "subtitle":[] } }
季节词子集
季节词子集是至少在一个俳句中使用的季节词数据集。
季节词子集示例: json { "id":1628, "word":"法師蟬", "kana":"ほうしぜみ", "old_kana":"ほふしぜみ", "season":"autumn", "subtitle":[ "つくつく法師", "つくつくし", "寒蟬" ] }




