chonkie-ai/wikipedia-500k
收藏Hugging Face2025-01-08 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/chonkie-ai/wikipedia-500k
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含id,url,title和text字段的数据集,主要用于训练机器学习模型。训练集包含500000个样本,数据集总大小为1993552348字节。
This dataset includes fields for id, url, title, and text, primarily intended for training machine learning models. The training set contains 500,000 samples, with the total dataset size being 1,993,552,348 bytes.
提供机构:
chonkie-ai



