fia24/filtered_annotated_100k_v2
收藏Hugging Face2024-02-01 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/fia24/filtered_annotated_100k_v2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含id和translation两个主要特征,其中translation是一个结构体,包含英文(en)和法文(fr)两个字段。数据集分为训练集(train)、验证集(val)和测试集(test)三个部分,分别包含76832、9604和9604个示例。数据集的下载大小为2962489字节,总大小为5616982字节。
该数据集包含id和translation两个主要特征,其中translation是一个结构体,包含英文(en)和法文(fr)两个字段。数据集分为训练集(train)、验证集(val)和测试集(test)三个部分,分别包含76832、9604和9604个示例。数据集的下载大小为2962489字节,总大小为5616982字节。
提供机构:
fia24
原始信息汇总
数据集概述
特征信息
- id: 数据类型为字符串。
- translation: 包含以下结构:
- en: 英文翻译,数据类型为字符串。
- fr: 法文翻译,数据类型为字符串。
数据分割
- train: 训练集,包含4502703字节,76832个样本。
- val: 验证集,包含552012字节,9604个样本。
- test: 测试集,包含562267字节,9604个样本。
数据集大小
- 下载大小: 2962489字节。
- 数据集大小: 5616982字节。
配置信息
- default: 配置包含以下数据文件路径:
- train:
data/train-* - val:
data/val-* - test:
data/test-*
- train:



