DamarJati/indocorpus-sastra
收藏Hugging Face2024-02-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DamarJati/indocorpus-sastra
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从印尼教育部和文化部提供的Korpus Indonesia中提取的印尼语文学文本,涵盖小说、短篇小说、诗歌、戏剧和文学批评等多种文学类型。数据集可用于印尼文学分析、文学研究、作者归属、体裁分类、文学文本情感分析等研究。请注意,该数据集可能与DamarJati/indocorpus-mix数据集存在部分重叠。
该数据集包含从印尼教育部和文化部提供的Korpus Indonesia中提取的印尼语文学文本,涵盖小说、短篇小说、诗歌、戏剧和文学批评等多种文学类型。数据集可用于印尼文学分析、文学研究、作者归属、体裁分类、文学文本情感分析等研究。请注意,该数据集可能与DamarJati/indocorpus-mix数据集存在部分重叠。
提供机构:
DamarJati
原始信息汇总
印度尼西亚文学语料库
描述
该数据集包含从印度尼西亚教育与文化部提供的印度尼西亚语料库中提取的印度尼西亚语语料库。该语料库特别关注文学文本,包括各种体裁,如小说、诗歌、戏剧和文学批评。
内容
数据集由印度尼西亚语的文学领域文本组成。这些文本涵盖了广泛的文学作品,包括小说、短篇故事、诗歌、剧本和批评性文章。
用途
该数据集可用于与印度尼西亚文学分析、文学研究、作者归属、体裁分类、文学文本的情感分析以及其他文学和人文学科领域的任务相关的各种研究和开发目的。
与其他数据集的兼容性
请注意,该数据集与DamarJati/indocorpus-mix数据集之间可能存在一些重叠。该数据集中的某些句子或段落也可能出现在上述数据集中。
许可证
该数据集是从印度尼西亚语料库获取的,由印度尼西亚教育与文化部提供。请确保检查并遵守原始来源的适用许可条款。



