five

NLPC-UOM/Writing-style-classification

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NLPC-UOM/Writing-style-classification
下载链接
链接失效反馈
官方服务:
资源简介:
该文件包含属于不同写作风格的新闻文本(句子)。原始数据集由Upeksha, D., Wijayarathna, C., Siriwardena, M., Lasandun, L., Wimalasuriya, C., de Silva, N., 和 Dias, G. (2015)创建,并经过处理和清理。
提供机构:
NLPC-UOM
原始信息汇总

数据集概述

基本信息

  • 数据集名称: sinhala-writing-style-classification
  • 语言: 僧伽罗语 (si)
  • 许可证: MIT
  • 多语言性: 单语种

数据集创建

  • 语言创建方式: 众包
  • 原始数据集创建者: Upeksha, D., Wijayarathna, C., Siriwardena, M., Lasandun, L., Wimalasuriya, C., de Silva, N., and Dias, G. (2015)
  • 原始数据集描述: 实现僧伽罗语语料库

数据集处理

  • 处理说明: 原始数据集已进行处理和清洗

任务类型

  • 任务类别: 文本分类

引用信息

  • 引用文献: Dhananjaya et al. BERTifying Sinhala - A Comprehensive Analysis of Pre-trained Language Models for Sinhala Text Classification, 2022
  • 引用要求: 使用本数据集时,请引用上述文献及原始数据集创建者的论文
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作