GGLab/GECTurk
收藏Hugging Face2024-02-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/GGLab/GECTurk
下载链接
链接失效反馈官方服务:
资源简介:
---
language:
- tr
license: apache-2.0
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: dev
path: data/dev-*
- split: test
path: data/test-*
- split: movie_reviews
path: data/movie_reviews-*
dataset_info:
features:
- name: tokens
sequence: string
- name: labels
sequence: int64
splits:
- name: train
num_bytes: 21679538
num_examples: 96919
- name: dev
num_bytes: 4656477
num_examples: 20769
- name: test
num_bytes: 4617039
num_examples: 20769
- name: movie_reviews
num_bytes: 86380
num_examples: 300
download_size: 12014485
dataset_size: 31039434
---
提供机构:
GGLab
原始信息汇总
数据集概述
语言
- 土耳其语 (tr)
许可证
- Apache 2.0
配置
- 默认配置 (
default)- 数据文件路径:
- 训练集 (
train):data/train-* - 开发集 (
dev):data/dev-* - 测试集 (
test):data/test-* - 电影评论 (
movie_reviews):data/movie_reviews-*
- 训练集 (
- 数据文件路径:
数据集信息
-
特征:
tokens: 字符串序列labels: 整数序列 (int64)
-
数据集划分:
- 训练集 (
train)- 字节数: 21679538
- 样本数: 96919
- 开发集 (
dev)- 字节数: 4656477
- 样本数: 20769
- 测试集 (
test)- 字节数: 4617039
- 样本数: 20769
- 电影评论 (
movie_reviews)- 字节数: 86380
- 样本数: 300
- 训练集 (
-
下载大小: 12014485 字节
-
数据集大小: 31039434 字节



