AdapterOcean/med_alpaca_standardized_cluster_52

Name: AdapterOcean/med_alpaca_standardized_cluster_52
Creator: AdapterOcean
Published: 2023-10-23 23:30:37
License: 暂无描述

Hugging Face2023-10-23 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/AdapterOcean/med_alpaca_standardized_cluster_52

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为med_alpaca_standardized_cluster_52，包含文本、对话ID、嵌入和聚类等特征，数据类型分别为字符串、整数、浮点数序列和整数。数据集主要分为训练集，共有15143个样本，总数据量为153423041字节，下载大小为45412107字节。数据集配置包括一个默认配置，训练数据文件路径为data/train-*。

提供机构：

AdapterOcean

原始信息汇总

数据集概述

数据集信息

特征

text: 数据类型为字符串。
conversation_id: 数据类型为64位整数。
embedding: 数据类型为64位浮点数序列。
cluster: 数据类型为64位整数。

数据分割

train: 包含15143个样本，总字节数为153423041。

数据大小

下载大小: 45412107字节
数据集大小: 153423041字节

配置

default: 包含训练数据文件，路径为data/train-*。

5,000+

优质数据集

54 个

任务类型

进入经典数据集