llama-duo/synth_summarize_dataset_backup
收藏Hugging Face2024-05-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/llama-duo/synth_summarize_dataset_backup
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: prompt
dtype: string
- name: prompt_id
dtype: string
- name: messages
list:
- name: content
dtype: string
- name: role
dtype: string
- name: category
dtype: string
- name: generator
dtype: string
- name: seed_prompt
dtype: string
splits:
- name: test
num_bytes: 89079
num_examples: 25
- name: train_sft_gpt4o
num_bytes: 124986007
num_examples: 32782
- name: train_sft_claude3sonnet
num_bytes: 129705923
num_examples: 30867
- name: train_sft_gemini1.5flash
num_bytes: 118854575
num_examples: 32070
- name: train_sft_gpt4o_8k
num_bytes: 320013303
num_examples: 81423
- name: train_sft_gemini1.5flash_8k
num_bytes: 320433270.361084
num_examples: 82111
download_size: 111174878
dataset_size: 1014082157.361084
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
- split: train_sft_gpt4o
path: data/train_sft_gpt4o-*
- split: train_sft_claude3sonnet
path: data/train_sft_claude3sonnet-*
- split: train_sft_gemini1.5flash
path: data/train_sft_gemini1.5flash-*
- split: train_sft_gpt4o_8k
path: data/train_sft_gpt4o_8k-*
- split: train_sft_gemini1.5flash_8k
path: data/train_sft_gemini1.5flash_8k-*
---
提供机构:
llama-duo
原始信息汇总
数据集概述
数据集特征
- prompt: 数据类型为字符串。
- prompt_id: 数据类型为字符串。
- messages: 列表类型,包含以下子特征:
- content: 数据类型为字符串。
- role: 数据类型为字符串。
- category: 数据类型为字符串。
- generator: 数据类型为字符串。
- seed_prompt: 数据类型为字符串。
数据集分割
- test: 大小为89079字节,包含25个样本。
- train_sft_gpt4o: 大小为124986007字节,包含32782个样本。
- train_sft_claude3sonnet: 大小为129705923字节,包含30867个样本。
- train_sft_gemini1.5flash: 大小为118854575字节,包含32070个样本。
- train_sft_gpt4o_8k: 大小为320013303字节,包含81423个样本。
- train_sft_gemini1.5flash_8k: 大小为320433270.361084字节,包含82111个样本。
数据集大小
- 下载大小: 111174878字节。
- 数据集总大小: 1014082157.361084字节。
配置文件
- config_name: default
- data_files:
- test: 路径为
data/test-*。 - train_sft_gpt4o: 路径为
data/train_sft_gpt4o-*。 - train_sft_claude3sonnet: 路径为
data/train_sft_claude3sonnet-*。 - train_sft_gemini1.5flash: 路径为
data/train_sft_gemini1.5flash-*。 - train_sft_gpt4o_8k: 路径为
data/train_sft_gpt4o_8k-*。 - train_sft_gemini1.5flash_8k: 路径为
data/train_sft_gemini1.5flash_8k-*。
- test: 路径为



