five

kothasuhas/1b-negatives-k150000-0-plz_SNIS_2048_1B-423-v1_N150.00K_N15.00M_T4.0

收藏
Hugging Face2025-04-26 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/kothasuhas/1b-negatives-k150000-0-plz_SNIS_2048_1B-423-v1_N150.00K_N15.00M_T4.0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含文本和其他相关特征,适用于机器学习模型的训练和验证。它由一个训练集和一个验证集组成,训练集包含1500万个样本,验证集包含1000个样本。数据集的特征包括文本内容、对数值和两种采样概率值。

The dataset includes text and other related features, suitable for training and validation of machine learning models. It consists of a training set with 15 million examples and a validation set with 1,000 examples. The features of the dataset include text content, logarithmic values, and two types of sampling probability values.
提供机构:
kothasuhas
二维码
社区交流群
二维码
科研交流群
商业服务