five

gokulsrinivasagan/processed_wikitext-103-raw-v1-ld-100

收藏
Hugging Face2024-11-18 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/gokulsrinivasagan/processed_wikitext-103-raw-v1-ld-100
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个主要特征:input_ids(int32序列)、attention_mask(int8序列)、special_tokens_mask(int8序列)和lda_lables(float64序列)。数据集分为三个部分:测试集(549个样本)、训练集(228639个样本)和验证集(479个样本)。数据集的下载大小为435923605字节,总大小为892945296字节。

The dataset contains four main features: input_ids (int32 sequence), attention_mask (int8 sequence), special_tokens_mask (int8 sequence), and lda_lables (float64 sequence). The dataset is divided into three parts: test (549 samples), train (228639 samples), and validation (479 samples). The download size of the dataset is 435923605 bytes, and the total size is 892945296 bytes.
提供机构:
gokulsrinivasagan
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作