AdapterOcean/Open_Platypus_standardized_embedded
收藏Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/AdapterOcean/Open_Platypus_standardized_embedded
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: conversation_id
dtype: int64
- name: embedding
sequence: float32
splits:
- name: train
num_bytes: 132683700
num_examples: 24925
download_size: 65430177
dataset_size: 132683700
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
# Dataset Card for "Open_Platypus_standardized_embedded"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
数据集信息:
特征字段:
- 名称:文本(text),数据类型:字符串型
- 名称:对话ID(conversation_id),数据类型:64位整型
- 名称:嵌入向量(embedding),数据类型:序列类型,元素为float32
数据集拆分:
- 拆分名称:训练集(train),字节数:132683700,样本数量:24925
下载大小:65430177
数据集总大小:132683700
配置项:
- 配置名称:默认配置(default),数据文件:
- 拆分:训练集(train),路径:data/train-*
# 「Open_Platypus_standardized_embedded」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
AdapterOcean
原始信息汇总
数据集概述
数据集信息
- 特征:
text: 类型为stringconversation_id: 类型为int64embedding: 类型为float32的序列
- 分割:
train: 包含 24925 个样本,占用 132683700 字节
数据集大小
- 下载大小: 65430177 字节
- 数据集大小: 132683700 字节
配置
- 配置名称:
default - 数据文件:
train: 路径为data/train-*



