BiniyamAjaw/amharic_dataset_v2
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BiniyamAjaw/amharic_dataset_v2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 154486240
num_examples: 416484
- name: test
num_bytes: 38621560
num_examples: 104121
download_size: 103633143
dataset_size: 193107800
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: test
path: data/test-*
license: mit
task_categories:
- text-generation
- text-classification
language:
- am
tags:
- Language
- News
- Ads
pretty_name: Amharic Dataset v2.0
size_categories:
- 100K<n<1M
---
提供机构:
BiniyamAjaw
原始信息汇总
数据集概述
数据集信息
-
特征:
- 名称: text
- 数据类型: string
-
分割:
- 训练集:
- 字节数: 154486240
- 样本数: 416484
- 测试集:
- 字节数: 38621560
- 样本数: 104121
- 训练集:
-
下载大小: 103633143
-
数据集大小: 193107800
配置
- 配置名称: default
- 数据文件:
- 训练集路径: data/train-*
- 测试集路径: data/test-*
许可
- 许可证: MIT
任务类别
- 文本生成
- 文本分类
语言
- 阿姆哈拉语 (am)
标签
- 语言
- 新闻
- 广告
数据集名称
- 名称: Amharic Dataset v2.0
大小类别
- 100K<n<1M



