five

kardosdrur/estonian-valence

收藏
Hugging Face2024-03-26 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/kardosdrur/estonian-valence
下载链接
链接失效反馈
官方服务:
资源简介:
Estonian Valence Dataset是一个包含来自Poostimees和Õhtuleht报纸的注释爱沙尼亚新闻数据的数据集。

Estonian Valence Dataset是一个包含来自Poostimees和Õhtuleht报纸的注释爱沙尼亚新闻数据的数据集。
提供机构:
kardosdrur
原始信息汇总

数据集概述

数据集配置

  • 默认配置 (config_name: default)
    • 训练数据 (split: train): path: data/train-*
    • 测试数据 (split: test): path: data/test-*

数据集信息

  • 特征 (features):

    • 类别 (name: category): 数据类型为字符串 (dtype: string)
    • 来源URL (name: sourceurl): 数据类型为字符串 (dtype: string)
    • NR (name: nr): 数据类型为浮点数 (dtype: float64)
    • 情感 (name: valence): 数据类型为字符串 (dtype: string)
    • 段落 (name: paragraph): 数据类型为字符串 (dtype: string)
  • 数据分割 (splits):

    • 训练集 (name: train):
      • 数据量 (num_bytes): 1173065.3057729942 字节
      • 样本数 (num_examples): 3270
    • 测试集 (name: test):
      • 数据量 (num_bytes): 293445.6942270059 字节
      • 样本数 (num_examples): 818
  • 数据集大小:

    • 下载大小 (download_size): 824504 字节
    • 数据集大小 (dataset_size): 1466511 字节
  • 许可证 (license): cc

任务类别 (task_categories)**:

  • 文本分类

语言 (language)**:

  • 爱沙尼亚语
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作