five

Alaamer/medium-articles-posts-with-content

收藏
Hugging Face2025-03-04 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/Alaamer/medium-articles-posts-with-content
下载链接
链接失效反馈
官方服务:
资源简介:
Medium文章数据集是一个综合了多个数据源的全面文章集合。该数据集不仅结合了多个来源,还通过归一化和去重确保了数据的质量。数据集中的每篇文章在text列中都是唯一的,确保了没有重复的文章。数据集支持文本分类和文本生成任务,并提供了多种文章特征,如音频版本时长、代码块、图片数量等。

The Medium Articles Dataset is a comprehensive collection of articles compiled from multiple sources. This dataset not only combines various sources but also ensures data quality through normalization and deduplication. Each article in the text column is unique, ensuring there are no duplicate articles in the final dataset. The dataset supports tasks such as text classification and text generation, and provides various article features like audio version duration, code blocks, image count, etc.
提供机构:
Alaamer
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作