medproofx-patches-hd-v6-complete
收藏Hugging Face2026-03-22 更新2026-03-23 收录
下载链接:
https://huggingface.co/datasets/Bharath23BAD302/medproofx-patches-hd-v6-complete
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个大规模的多模态数据集,主要包含图像和文本数据。数据集结构包含多个特征字段,其中'patches'和'cls_token'可能表示图像的分块特征和分类标记,'conversations'字段包含对话文本('from'和'value'字段),表明可能用于对话或问答任务。图像相关特征包括宽度、高度、宽高比、锐度、对比度等质量指标,以及是否为灰度图像的标记。文本相关特征包括问题和答案的token数量。数据集被划分为200多个分块(chunk),每个分块约含3000个样本,总样本量约60万。数据集总大小约1.48TB,适用于多模态学习、视觉语言模型训练、图像文本对话等任务。
创建时间:
2026-03-21



