MongoDB/tech-news-embeddings
收藏Hugging Face2024-02-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MongoDB/tech-news-embeddings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由HackerNoon整理,包含了2022年和2023年关于3000多家最有价值科技公司的700多万篇科技新闻文章和博客文章。为了增强数据集的实用性,使用OpenAI的EMBEDDING_MODEL为每个数据点添加了新的嵌入字段和向量嵌入。数据集的结构包括每个新闻文章的多个字段,如唯一标识符、公司名称、发布日期、文章URL、标题、主图像URL、描述和嵌入向量。该数据集适用于科技行业趋势分析、搜索和推荐系统增强、情感分析等多种应用场景。
提供机构:
MongoDB
原始信息汇总
数据集概述
数据来源
- 数据集由HackerNoon整理。
数据内容
- 包含2022年和2023年关于3000多家最有价值的科技公司的700万篇以上科技公司新闻文章和博客文章。



