five

nyuuzyou/kompy

收藏
Hugging Face2024-11-05 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/nyuuzyou/kompy
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含从kompy.info网站提取的584,648页乌兹别克语教育内容,主要涉及技术和科学主题。数据集的结构包括URL、标题和正文文本字段。所有数据都在一个单一的分割中。数据集使用CC0许可证,允许任何目的的使用、修改和分发。

This dataset contains 584,648 pages of educational content in Uzbek language extracted from the kompy.info website. The content includes academic and educational materials, with a focus on technical and scientific topics. The dataset includes the following fields: url (URL of the webpage), title (Title of the page/article), text (Main content text extracted from the page). All examples are in a single split. The dataset is dedicated to the public domain under the Creative Commons Zero (CC0) license, meaning it can be used for any purpose, including commercial projects, without attribution.
提供机构:
nyuuzyou
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作