neody/kusanagi
收藏Hugging Face2024-07-08 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/neody/kusanagi
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个主要特征:text和source,均为字符串类型。数据集分为一个训练集(train),包含88917425个样本,总大小为36838989677字节。数据集的下载大小为23249811683字节。此外,数据集有一个默认配置(default),其训练数据文件位于data/train-*路径下。
该数据集包含两个主要特征:text和source,均为字符串类型。数据集分为一个训练集(train),包含88917425个样本,总大小为36838989677字节。数据集的下载大小为23249811683字节。此外,数据集有一个默认配置(default),其训练数据文件位于data/train-*路径下。
提供机构:
neody
原始信息汇总
数据集概述
语言
- 日语 (ja)
数据集信息
特征
- text: 数据类型为字符串 (string)
- source: 数据类型为字符串 (string)
分割
- train:
- 字节数: 69,486,918,738
- 样本数: 156,273,425
下载和数据集大小
- 下载大小: 38,705,915,861 字节
- 数据集大小: 69,486,918,738 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



