faisaltareque/multilingual-news-prompt
收藏Hugging Face2023-09-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/faisaltareque/multilingual-news-prompt
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: headline
dtype: string
- name: article
dtype: string
- name: lang
dtype: string
- name: image_caption_separated
dtype: string
- name: topic_word_separated
dtype: string
- name: image_based_top_3
dtype: string
- name: caption_based_top_3
dtype: string
- name: image_based_top_5
dtype: string
- name: caption_based_top_5
dtype: string
- name: image_based_top_10
dtype: string
- name: caption_based_top_10
dtype: string
- name: image_based_top_15
dtype: string
- name: caption_based_top_15
dtype: string
- name: topic_word_separated_new
dtype: string
- name: topic_word_count_new
dtype: int64
- name: prompt_type
dtype: string
- name: article_prompt
dtype: string
splits:
- name: train
num_bytes: 9136949083
num_examples: 394353
- name: valid
num_bytes: 121366337
num_examples: 5187
- name: test
num_bytes: 358666498
num_examples: 15577
download_size: 5317632829
dataset_size: 9616981918
---
# Dataset Card for "multilingual-news-prompt"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
faisaltareque
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- headline: 字符串类型
- article: 字符串类型
- lang: 字符串类型
- image_caption_separated: 字符串类型
- topic_word_separated: 字符串类型
- image_based_top_3: 字符串类型
- caption_based_top_3: 字符串类型
- image_based_top_5: 字符串类型
- caption_based_top_5: 字符串类型
- image_based_top_10: 字符串类型
- caption_based_top_10: 字符串类型
- image_based_top_15: 字符串类型
- caption_based_top_15: 字符串类型
- topic_word_separated_new: 字符串类型
- topic_word_count_new: 64位整数类型
- prompt_type: 字符串类型
- article_prompt: 字符串类型
数据分割
- train:
- 字节数: 9136949083
- 样本数: 394353
- valid:
- 字节数: 121366337
- 样本数: 5187
- test:
- 字节数: 358666498
- 样本数: 15577
数据集大小
- 下载大小: 5317632829 字节
- 数据集总大小: 9616981918 字节



