ChavyvAkvar/FineWeb2-HQ-1M-Sample-Viet
收藏Hugging Face2025-09-27 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/ChavyvAkvar/FineWeb2-HQ-1M-Sample-Viet
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含文本数据的数据集,用于文本处理或分析。数据集中的文本被赋予了ID、日期、语言等信息,并包含了文本的嵌入表示和聚类信息。数据集分为训练集,共有100万个样本。
This is a dataset containing text data for text processing or analysis. The text in the dataset is associated with IDs, dates, languages, and includes embedded representations and clustering information. The dataset is split into a training set with a total of 1 million samples.
提供机构:
ChavyvAkvar



