CopyMark|AI模型安全数据集|版权保护数据集
收藏CopyMark 数据集概述
数据集内容
CopyMark 数据集包含以下内容:
-
diffusers 目录:
- assets:用于案例研究的数据,包括图像。
- datasets:存放数据集的目录。
- experiments:原始实验结果的记录数据。
- utils:用于准备数据集和生成元数据的脚本。
-
ui/custom_nodes/assets:用于版权检测推理的元数据。
数据集用途
CopyMark 数据集用于版权检测,主要应用于以下场景:
- 在 Latent Diffusion Model、Stable Diffusion 和 SDXL 模型上进行版权检测的基准测试。
- 提供图形用户界面(GUI),用于检测扩散模型训练数据中的版权图像。
数据集结构
数据集的代码结构如下:
CopyMark
│ README.md
│ requirements.txt
│
└───diffusers # 基准测试
│ └───assets # 案例研究图像数据
│ └───copymark # 版权检测的 diffusers 管道代码
│ └───datasets # 数据集存放目录
│ └───experiments # 原始实验结果记录
│ └───scripts # 版权检测方法的脚本
│ └───utils # 数据集准备和元数据生成脚本
│
└───ui
│ └───custom_nodes
│ └───assets # 版权检测推理的元数据
│ └───diffusers_ui # 版权检测的 diffusers 管道代码
│ │ copymark.py # 版权检测功能代码
│ │ encode_diffusers.py # 图像和文本编码功能代码
│ │ load_diffusers.py # 模块加载功能代码
│ │ nodes_copymark.py # 版权检测的自定义节点代码
│ │ nodes_diffusers.py # 适配 diffusers 到 comfyui 的自定义节点代码

中国1km分辨率逐月降水量数据集(1901-2024)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
广东省标准地图
该数据类主要为广东省标准地图信息。标准地图依据中国和世界各国国界线画法标准编制而成。该数据包括广东省全图、区域地图、地级市地图、县(市、区)地图、专题地图、红色印迹地图等分类。
开放广东 收录
DFT dataset for high entropy alloys
我们的DFT数据集涵盖了由八种元素组成的bcc和fcc结构,包括所有可能的2至7元合金系统。该数据集在Zenodo上公开可用,包含初始和最终结构、形成能量、原子磁矩和电荷等属性。
github 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
EcoInvent
EcoInvent是一个生命周期评估(LCA)数据库,包含了大量产品的环境影响数据。它提供了详细的产品生命周期数据,包括原材料提取、生产、使用和废弃处理等各个阶段的环境影响信息。
www.ecoinvent.org 收录