five

damerajee/VQA-COCO-HI

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/damerajee/VQA-COCO-HI
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: conversations dtype: string splits: - name: train num_bytes: 8497319471.19 num_examples: 50010 download_size: 8207838457 dataset_size: 8497319471.19 configs: - config_name: default data_files: - split: train path: data/train-* license: cc-by-nc-4.0 task_categories: - visual-question-answering - question-answering language: - hi tags: - VQA pretty_name: VQA size_categories: - 100K<n<1M --- # Dataset Information This dataset was translated from [ShareGPTV](https://huggingface.co/datasets/Lin-Chen/ShareGPT4V) English to Hindi **Paper or resources for more information:** [[Project](https://ShareGPT4V.github.io/)] [[Paper](https://huggingface.co/papers/2311.12793)] [[Code](https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V)] **License:** Attribution-NonCommercial 4.0 International It should abide by the policy of OpenAI: https://openai.com/policies/terms-of-use ## Intended use **Primary intended uses:** The primary use of ShareGPT4V Captions 1.2M is research on large multimodal models and chatbots. **Primary intended users:** The primary intended users of this dataset are researchers and hobbyists in computer vision, natural language processing, machine learning, and artificial intelligence. # Additional Question ### How good is the translation? The translation was done using goggle translate which is quite reliable althought it took me almost 1 month to manually check if it was actually good enough,Here are some examples: | Hindi Text | English Text | | --- | --- | | आप इस छवि में क्या होता हुआ देख रहे हैं? | What do you see happening in this image? | | छवि के केंद्र में, एक जीवंत नीली लंच ट्रे में चार कंटेनर हैं, जिनमें से प्रत्येक विभिन्न प्रकार के खाद्य पदार्थों से भरा हुआ है। कंटेनर, दो गुलाबी रंग में और दो पीले रंग में, 2x2 ग्रिड में व्यवस्थित हैं। | In the center of the image, there are four containers on a blue lunch tray, each filled with different types of food items. The containers are arranged in a 2x2 grid, with two pink containers and two yellow containers. | | ऊपरी बाएँ गुलाबी कंटेनर में, ब्रेड का एक टुकड़ा रखा हुआ है, जिस पर हल्के से मक्खन लगाया गया है और मुट्ठी भर बादाम छिड़के हुए हैं। ब्रेड को एक आयत में काटा जाता है, और बादाम उसकी मक्खन जैसी सतह पर बिखरे होते हैं। | In the top left pink container, there is a slice of bread with a thin layer of butter and a handful of sliced almonds scattered on top. The bread is cut into a single piece, and the almonds are spread over its butter-like surface. | | इसके बगल में ऊपरी दाएं कोने में, एक अन्य गुलाबी कंटेनर में फलों का मिश्रण रखा हुआ है। कटे हुए सेब, जिनका ताजा सफेद आंतरिक भाग खुला हुआ है, अनानास के रसीले टुकड़ों के साथ स्थान साझा करते हैं। सेब के स्लाइस और अनानास के टुकड़ों का रंग गुलाबी कंटेनर के विपरीत खूबसूरती से विपरीत है। | To the right of this, in the top right container, there is a fruit mix. Sliced apples, whose fresh white interior is visible, share space with juicy pineapple chunks. The color of the apple slices and pineapple chunks contrasts beautifully with the pink container. | | इनके नीचे, ट्रे के निचले बाएँ कोने में, एक पीले कंटेनर में कुछ ब्रोकोली के साथ एक मीटबॉल रखा हुआ है। मीटबॉल, गोल और भूरा, जीवंत हरे ब्रोकोली फूलों के बगल में बैठता है। | Below this, in the lower left corner of the tray, there is a yellow container with some broccoli and a meatball. The meatball, round and brown, sits amidst the vibrant green broccoli florets. | | अंत में, नीचे दाएँ पीले कंटेनर में, एक मीठी चीज़ है - एक चॉकलेट चिप कुकी। सुनहरे-भूरे रंग की कुकी चॉकलेट चिप्स से भरी हुई है, उनका गहरा रंग कुकी की हल्की सतह के सामने स्पष्ट दिखता है। | Finally, in the lower right yellow container, there is a sweet treat - a chocolate chip cookie. The golden-brown cookie is filled with chocolate chips, their dark color clearly visible against the light surface of the cookie. | | नीली ट्रे पर इन कंटेनरों की व्यवस्था देखने में आकर्षक और संतुलित भोजन बनाती है, जिसमें प्रत्येक घटक को बड़े करीने से अलग किया जाता है, फिर भी एक एकजुट संपूर्ण हिस्सा होता है। | The arrangement of these containers on the blue tray is attractive and makes for a balanced meal, where each item is separated, yet together they form a complete whole. | `All of this text above is all in one row`
提供机构:
damerajee
原始信息汇总

数据集概述

数据集信息

  • 特征(Features):

    • image: 图像数据类型。
    • conversations: 字符串数据类型。
  • 分割(Splits):

    • train: 训练集,包含50010个示例,总大小为8497319471.19字节。
  • 下载大小(Download Size): 8207838457字节。

  • 数据集大小(Dataset Size): 8497319471.19字节。

  • 配置(Configs):

    • default: 包含训练数据文件,路径为data/train-*
  • 许可证(License): cc-by-nc-4.0

  • 任务类别(Task Categories):

    • 视觉问答(visual-question-answering)
    • 问答(question-answering)
  • 语言(Language): 印地语(hi)

  • 标签(Tags): VQA

  • 美观名称(Pretty Name): VQA

  • 大小类别(Size Categories): 100K<n<1M

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作