five

argilla/websight-5K-multimodal

收藏
Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/websight-5K-multimodal
下载链接
链接失效反馈
官方服务:
资源简介:
数据集websight-5K-multimodal是从Websight集合中提取的5000条记录的子集,使用Argilla创建。它用于从输入图像生成HTML/CSS代码。数据集包括Argilla的配置文件、与HuggingFace的`datasets`库兼容的记录以及注释指南。根据数据集配置,它支持各种NLP任务。数据集结构包括字段、问题、建议、元数据、向量和指南。字段是数据集记录,主要是文本字段,问题则用于评估生成代码的准确性、质量和修正。数据集可以使用Argilla或`datasets`库加载。

数据集websight-5K-multimodal是从Websight集合中提取的5000条记录的子集,使用Argilla创建。它用于从输入图像生成HTML/CSS代码。数据集包括Argilla的配置文件、与HuggingFace的`datasets`库兼容的记录以及注释指南。根据数据集配置,它支持各种NLP任务。数据集结构包括字段、问题、建议、元数据、向量和指南。字段是数据集记录,主要是文本字段,问题则用于评估生成代码的准确性、质量和修正。数据集可以使用Argilla或`datasets`库加载。
提供机构:
argilla
原始信息汇总

数据集卡片 - websight-5K-multimodal

数据集描述

数据集概述

该数据集包含以下内容:

  • 一个符合Argilla数据集格式的配置文件,名为argilla.yaml,用于在使用Argilla的FeedbackDataset.from_huggingface方法时配置数据集。
  • 兼容HuggingFace datasets格式的数据集记录,这些记录在使用FeedbackDataset.from_huggingface时会自动加载,也可以通过datasets库的load_dataset方法独立加载。
  • 用于构建和整理数据集的注释指南,如果已在Argilla中定义。

加载方法

  • 使用Argilla加载: python import argilla as rg ds = rg.FeedbackDataset.from_huggingface("argilla/websight-5K-multimodal")

  • 使用datasets库加载: python from datasets import load_dataset ds = load_dataset("argilla/websight-5K-multimodal")

支持的任务和排行榜

该数据集可以包含多个字段、问题和响应,因此可以用于不同的NLP任务,具体取决于配置。数据集结构在数据集结构部分描述。

该数据集没有关联的排行榜。

语言

[更多信息需要]

数据集结构

数据在Argilla中的结构

数据集在Argilla中包含以下元素:

  • 字段:数据集记录本身,目前仅支持文本字段。这些字段将用于提供对问题的响应。

    字段名称 标题 类型 必需 Markdown
    image Image text True True
    html_code Html_code text True True
  • 问题:将向注释者提出的问题。可以是不同类型,如评分、文本、标签选择、多标签选择或排名。

    问题名称 标题 类型 必需 描述 值/标签
    accuracy 评估生成的代码是否准确反映了图像中的布局、设计元素和样式。 rating True N/A [1, 2, 3, 4, 5, 6, 7]
    quality 评估生成的代码的清洁度、效率和正确的HTML/CSS实践。 multi_label_selection True N/A [clean code, efficient, proper tags and classes]
    correction 识别生成的HTML/CSS代码中的任何错误或问题,并建议可能的更正。 text True N/A N/A
  • 建议:人类或机器生成的针对每个问题的建议,以协助注释者在注释过程中使用。这些建议始终与现有问题相关联,并通过在问题名称后附加"-suggestion"和"-suggestion-metadata"来命名,包含建议的值及其元数据。

  • 元数据:一个字典,用于提供有关数据集记录的额外信息。这可以用于向注释者提供额外上下文,或提供有关数据集记录本身的额外信息。元数据始终是可选的,并且可能与数据集配置文件中的metadata_properties定义相关联。

  • 指南:可选的纯文本字符串,用于向注释者提供说明。这些指南在注释指南部分中找到。

数据实例

一个数据集实例在Argilla中的示例如下: json { "external_id": null, "fields": { "html_code": "json u003chtmlu003e u003cstyleu003e body { font-family: Arial, sans-serif; margin: 0; padding: 0; border-box; }

header { background: #ff0; text-align: center; padding: 20px; }

#video-container { width: 70%; margin: auto; text-align: center; }

#video-player { width: 100%; height: 300px; background: #f0f; }

#chef-tips { margin: 40px; }

#chef-tips p { color: #000; line-height: 1.6; }

footer { background: #ff0; text-align: center; padding: 20px; position: fixed; width: 100%; bottom: 0; } u003c/styleu003e u003cbodyu003e u003cheaderu003e u003ch1u003eInteru0027nationalu003c/h1u003e u003c/headeru003e u003cmainu003e u003csection id="video-container"u003e u003cvideo id="video-player" src="#" controlsu003eu003c/videou003e u003c/sectionu003e u003csection id="chef-tips"u003e u003ch2u003eChefu0027s Tipsu003c/h2u003e u003cpu003eEnjoy the tasty and healthy recipes shared by the best internationally recognized chefs. Discover the latest cooking trends and techniques.u003c/pu003e u003c/sectionu003e u003c/mainu003e u003cfooteru003e u003cpu003eu00a9 2022 Interu0027national. All rights reserved.u003c/pu003e u003c/footeru003e u003c/bodyu003e u003c/htmlu003e ", "image": "u003cimg src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAABQAAAALQCAYAAADPfd1WAAB/xElEQVR4nOzdeZxWdd0//vc1DCDgIIsOLlgJBoqJicKN4ZalpoXeZlpf03JJU8/0cskyl8rd8q4009JSbzUx09xSzCUjd1NTFPcCFZBlYAaGZWbO7/qcM8/5nHPuPZ/znHOd61zn3HPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHPuPZ/znHP

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作