fscheffczyk/2D_20newsgroups_embeddings
收藏Hugging Face2023-02-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/fscheffczyk/2D_20newsgroups_embeddings
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含20newsgroup数据集的降维向量嵌入,这些嵌入是通过scikit-learn库中的TruncatedSVD函数生成的,并且基于fscheffczyk/20newsgroup_embeddings数据集。
提供机构:
fscheffczyk
原始信息汇总
数据集概述
- 名称: Dimensional reduced feature vector embeddings of the 20newsgroup dataset
- 语言: 英语 (en)
- 多语言性: 单语
- 标签:
- news
- 20newsgroups
- 任务类别:
- 特征提取
- 句子相似性
- 问答
- 数据集大小: 未知
- 源数据集: 扩展自 fscheffczyk/20newsgroups_embeddings
数据集描述
- 概要: 该数据集包含20newsgroup数据集的维度降低向量嵌入。这些嵌入是通过使用scikit-learn库中的TruncatedSVD函数创建的,且基于fscheffczyk/20newsgroup_embeddings数据集。
数据集结构
- 数据实例: 信息缺失
- 数据字段: 信息缺失
- 数据分割: 信息缺失
数据集创建
- 筛选理由: 信息缺失
- 源数据:
- 初始数据收集和规范化: 信息缺失
- 源语言生产者: 信息缺失
- 注释:
- 注释过程: 信息缺失
- 注释者: 信息缺失
- 个人和敏感信息: 信息缺失
使用数据集的考虑
- 数据集的社会影响: 信息缺失
- 偏见讨论: 信息缺失
- 其他已知限制: 信息缺失
附加信息
- 数据集管理员: 信息缺失
- 许可信息: 信息缺失
- 引用信息: 信息缺失
- 贡献: 感谢@github-username添加此数据集。



