NLPC-UOM/Writing-style-classification
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NLPC-UOM/Writing-style-classification
下载链接
链接失效反馈官方服务:
资源简介:
该文件包含属于不同写作风格的新闻文本(句子)。原始数据集由Upeksha, D., Wijayarathna, C., Siriwardena, M., Lasandun, L., Wimalasuriya, C., de Silva, N., 和 Dias, G. (2015)创建,并经过处理和清理。
提供机构:
NLPC-UOM
原始信息汇总
数据集概述
基本信息
- 数据集名称: sinhala-writing-style-classification
- 语言: 僧伽罗语 (si)
- 许可证: MIT
- 多语言性: 单语种
数据集创建
- 语言创建方式: 众包
- 原始数据集创建者: Upeksha, D., Wijayarathna, C., Siriwardena, M., Lasandun, L., Wimalasuriya, C., de Silva, N., and Dias, G. (2015)
- 原始数据集描述: 实现僧伽罗语语料库
数据集处理
- 处理说明: 原始数据集已进行处理和清洗
任务类型
- 任务类别: 文本分类
引用信息
- 引用文献: Dhananjaya et al. BERTifying Sinhala - A Comprehensive Analysis of Pre-trained Language Models for Sinhala Text Classification, 2022
- 引用要求: 使用本数据集时,请引用上述文献及原始数据集创建者的论文



