five

MongoDB/tech-news-embeddings

收藏
Hugging Face2024-02-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/MongoDB/tech-news-embeddings
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由HackerNoon整理,包含了2022年和2023年关于3000多家最有价值科技公司的700多万篇科技新闻文章和博客文章。为了增强数据集的实用性,使用OpenAI的EMBEDDING_MODEL为每个数据点添加了新的嵌入字段和向量嵌入。数据集的结构包括每个新闻文章的多个字段,如唯一标识符、公司名称、发布日期、文章URL、标题、主图像URL、描述和嵌入向量。该数据集适用于科技行业趋势分析、搜索和推荐系统增强、情感分析等多种应用场景。
提供机构:
MongoDB
原始信息汇总

数据集概述

数据来源

  • 数据集由HackerNoon整理。

数据内容

  • 包含2022年和2023年关于3000多家最有价值的科技公司的700万篇以上科技公司新闻文章和博客文章。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作