Ramyaa/fce_v2.1
收藏Hugging Face2023-07-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Ramyaa/fce_v2.1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含三个主要特征:src_tokens、tgt_tokens和corrections。src_tokens和tgt_tokens是字符串序列,corrections是一个包含idx_src、idx_tgt和corr_type的列表。数据集分为训练集、验证集和测试集,分别包含28350、2191和2695个样本。数据集的总下载大小为2774021字节,总大小为10150154字节。
该数据集包含三个主要特征:src_tokens、tgt_tokens和corrections。src_tokens和tgt_tokens是字符串序列,corrections是一个包含idx_src、idx_tgt和corr_type的列表。数据集分为训练集、验证集和测试集,分别包含28350、2191和2695个样本。数据集的总下载大小为2774021字节,总大小为10150154字节。
提供机构:
Ramyaa
原始信息汇总
数据集概述
数据集特征
- src_tokens: 字符串序列
- tgt_tokens: 字符串序列
- corrections: 列表,包含以下元素
- idx_src: 整数序列(int32)
- idx_tgt: 整数序列(int32)
- corr_type: 字符串类型
数据集划分
- 训练集 (train):
- 字节数: 8658209
- 示例数: 28350
- 验证集 (validation):
- 字节数: 668073
- 示例数: 2191
- 测试集 (test):
- 字节数: 823872
- 示例数: 2695
数据集大小
- 下载大小: 2774021字节
- 数据集总大小: 10150154字节



