five

fscheffczyk/2D_20newsgroups_embeddings

收藏
Hugging Face2023-02-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fscheffczyk/2D_20newsgroups_embeddings
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含20newsgroup数据集的降维向量嵌入,这些嵌入是通过scikit-learn库中的TruncatedSVD函数生成的,并且基于fscheffczyk/20newsgroup_embeddings数据集。
提供机构:
fscheffczyk
原始信息汇总

数据集概述

  • 名称: Dimensional reduced feature vector embeddings of the 20newsgroup dataset
  • 语言: 英语 (en)
  • 多语言性: 单语
  • 标签:
    • news
    • 20newsgroups
  • 任务类别:
    • 特征提取
    • 句子相似性
    • 问答
  • 数据集大小: 未知
  • 源数据集: 扩展自 fscheffczyk/20newsgroups_embeddings

数据集描述

  • 概要: 该数据集包含20newsgroup数据集的维度降低向量嵌入。这些嵌入是通过使用scikit-learn库中的TruncatedSVD函数创建的,且基于fscheffczyk/20newsgroup_embeddings数据集。

数据集结构

  • 数据实例: 信息缺失
  • 数据字段: 信息缺失
  • 数据分割: 信息缺失

数据集创建

  • 筛选理由: 信息缺失
  • 源数据:
    • 初始数据收集和规范化: 信息缺失
    • 源语言生产者: 信息缺失
  • 注释:
    • 注释过程: 信息缺失
    • 注释者: 信息缺失
  • 个人和敏感信息: 信息缺失

使用数据集的考虑

  • 数据集的社会影响: 信息缺失
  • 偏见讨论: 信息缺失
  • 其他已知限制: 信息缺失

附加信息

  • 数据集管理员: 信息缺失
  • 许可信息: 信息缺失
  • 引用信息: 信息缺失
  • 贡献: 感谢@github-username添加此数据集。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作