pseudolab/autotrain-data-Medical_Terminology_Zephyr_2

Name: pseudolab/autotrain-data-Medical_Terminology_Zephyr_2
Creator: pseudolab
Published: 2023-11-06 08:54:52
License: 暂无描述

Hugging Face2023-11-06 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/pseudolab/autotrain-data-Medical_Terminology_Zephyr_2

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: tags dtype: string - name: categories dtype: string - name: topics dtype: string - name: title dtype: string - name: es-title dtype: string - name: url dtype: string - name: es-bite dtype: string - name: audience dtype: string - name: segment dtype: string - name: insurance-status dtype: string - name: state dtype: string - name: condition dtype: string - name: autotrain_text dtype: string splits: - name: train num_bytes: 123044 num_examples: 257 - name: validation num_bytes: 123044 num_examples: 257 download_size: 128192 dataset_size: 246088 configs: - config_name: default data_files: - split: train path: data/train-* - split: validation path: data/validation-* --- # Dataset Card for "autotrain-data-Medical_Terminology_Zephyr_2" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息：特征： - 名称：标签（tags），数据类型：字符串 - 名称：分类（categories），数据类型：字符串 - 名称：主题（topics），数据类型：字符串 - 名称：标题（title），数据类型：字符串 - 名称：西班牙语标题（es-title），数据类型：字符串 - 名称：链接（url），数据类型：字符串 - 名称：西班牙语短句摘要（es-bite），数据类型：字符串 - 名称：受众（audience），数据类型：字符串 - 名称：细分领域（segment），数据类型：字符串 - 名称：保险状态（insurance-status），数据类型：字符串 - 名称：州/地区（state），数据类型：字符串 - 名称：病症（condition），数据类型：字符串 - 名称：AutoTrain文本（autotrain_text），数据类型：字符串数据集划分： - 名称：训练集（train），字节占用量：123044，样本数：257 - 名称：验证集（validation），字节占用量：123044，样本数：257 下载大小：128192，数据集总大小：246088 配置： - 配置名称：默认配置（default），数据文件： - 训练集划分：data/train-* - 验证集划分：data/validation-* --- # "autotrain-data-Medical_Terminology_Zephyr_2"数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

提供机构：

pseudolab

原始信息汇总

数据集信息

特征

tags: 字符串类型
categories: 字符串类型
topics: 字符串类型
title: 字符串类型
es-title: 字符串类型
url: 字符串类型
es-bite: 字符串类型
audience: 字符串类型
segment: 字符串类型
insurance-status: 字符串类型
state: 字符串类型
condition: 字符串类型
autotrain_text: 字符串类型

数据分割

train:
- 字节数: 123044
- 样本数: 257
validation:
- 字节数: 123044
- 样本数: 257

数据大小

下载大小: 128192 字节
数据集大小: 246088 字节

配置

config_name: default
- data_files:
  - train: data/train-*
  - validation: data/validation-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集