five

gorkemsevinc/MultiTurnCleanup_flan-t5-xxl_preprocess

收藏
Hugging Face2023-12-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/gorkemsevinc/MultiTurnCleanup_flan-t5-xxl_preprocess
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: Conversation dtype: string - name: Combined Dialogue dtype: string splits: - name: test num_bytes: 235775 num_examples: 64 - name: train num_bytes: 5511351 num_examples: 930 - name: dev num_bytes: 324714 num_examples: 86 download_size: 3437254 dataset_size: 6071840 --- # Dataset Card for "YOUR_DATASET_NAME_DEV_YOK" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

数据集信息: 特征字段: - 字段名:对话(Conversation) 数据类型:字符串 - 字段名:组合对话(Combined Dialogue) 数据类型:字符串 划分集: - 划分集名称:测试集(test) 字节大小:235775 样本数量:64 - 划分集名称:训练集(train) 字节大小:5511351 样本数量:930 - 划分集名称:开发集(dev) 字节大小:324714 样本数量:86 下载大小:3437254 数据集总大小:6071840 --- # 「YOUR_DATASET_NAME_DEV_YOK」数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
gorkemsevinc
原始信息汇总

数据集概述

数据集信息

特征

  • Conversation: 数据类型为字符串。
  • Combined Dialogue: 数据类型为字符串。

分割

  • test: 包含64个样本,大小为235775字节。
  • train: 包含930个样本,大小为5511351字节。
  • dev: 包含86个样本,大小为324714字节。

大小

  • 下载大小: 3437254字节。
  • 数据集大小: 6071840字节。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作