nayohan/parallel_enko_feedback_collection_full

Name: nayohan/parallel_enko_feedback_collection_full
Creator: nayohan
Published: 2024-05-20 16:29:07
License: 暂无描述

Hugging Face2024-05-20 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/nayohan/parallel_enko_feedback_collection_full

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含英语和韩语的平行语料，每个句子都有来源和类别的标注，并且包含了英语和韩语句子的token长度信息。数据集分为训练集、验证集和测试集，分别包含97712、500和500个样本。此外，数据集还过滤掉了翻译数据集中重复的1240个句子，最终样本数量从99,952减少到98,712。

提供机构：

nayohan

原始信息汇总

数据集概述

config_name: default
data_files:
- train: 路径为 data/train-*
- valid: 路径为 data/valid-*
- test: 路径为 data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集