five

AdoCleanCode/DNS_train_002_train

收藏
Hugging Face2025-11-24 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/AdoCleanCode/DNS_train_002_train
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: sequence dtype: string - name: length dtype: int64 - name: clean_file dtype: string - name: noise_file dtype: string splits: - name: batch_0000 num_bytes: 1591258254 num_examples: 25000 - name: batch_0001 num_bytes: 1591274433 num_examples: 25000 - name: batch_0002 num_bytes: 1591265727 num_examples: 25000 - name: batch_0003 num_bytes: 1591270090 num_examples: 25000 - name: batch_0004 num_bytes: 1591260224 num_examples: 25000 download_size: 3363362816 dataset_size: 7956328728 configs: - config_name: default data_files: - split: batch_0000 path: data/batch_0000-* - split: batch_0001 path: data/batch_0001-* - split: batch_0002 path: data/batch_0002-* - split: batch_0003 path: data/batch_0003-* - split: batch_0004 path: data/batch_0004-* ---

数据集信息: 特征: - 名称: sequence 数据类型: 字符串 - 名称: length 数据类型: int64 - 名称: clean_file 数据类型: 字符串 - 名称: noise_file 数据类型: 字符串 拆分: - 名称: batch_0000 字节数: 1591258254 样本数: 25000 - 名称: batch_0001 字节数: 1591274433 样本数: 25000 - 名称: batch_0002 字节数: 1591265727 样本数: 25000 - 名称: batch_0003 字节数: 1591270090 样本数: 25000 - 名称: batch_0004 字节数: 1591260224 样本数: 25000 下载大小: 3363362816 数据集大小: 7956328728 配置: - 配置名称: default 数据文件: - 拆分: batch_0000 路径: data/batch_0000-* - 拆分: batch_0001 路径: data/batch_0001-* - 拆分: batch_0002 路径: data/batch_0002-* - 拆分: batch_0003 路径: data/batch_0003-* - 拆分: batch_0004 路径: data/batch_0004-*
提供机构:
AdoCleanCode
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作