ConsisID-preview-Data|文本到视频生成数据集|身份一致性数据集
收藏ConsisID 数据集概述
数据集描述
- 名称: ConsisID
- 类型: 文本到视频生成数据集
- 用途: 用于训练和评估身份保持的文本到视频生成模型
数据集下载
- 链接: HuggingFace
- 命令: bash huggingface-cli download --repo-type dataset BestWishYsh/ConsisID-preview-Data --local-dir BestWishYsh/ConsisID-preview-Data
数据集结构
-
数据格式:
📦 datasets/ ├── 📂 captions/ │ ├── 📄 dataname_1.json │ ├── 📄 dataname_2.json ├── 📂 dataname_1/ │ ├── 📂 refine_bbox_jsons/ │ ├── 📂 track_masks_data/ │ ├── 📂 videos/ ├── 📂 dataname_2/ │ ├── 📂 refine_bbox_jsons/ │ ├── 📂 track_masks_data/ │ ├── 📂 videos/ ├── ... ├── 📄 total_train_data.txt
数据集预览
- 示例: 可在项目页面查看部分样本
数据集处理
- 数据预处理代码: 即将发布
数据集使用
- 训练:
-
环境设置: bash git clone --depth=1 https://github.com/PKU-YuanGroup/ConsisID.git cd ConsisID conda create -n consisid python=3.11.0 conda activate consisid pip install -r requirements.txt
-
训练脚本: bash
For single rank
bash train_single_rank.sh
For multi rank
bash train_multi_rank.sh
-
许可证
- 许可证类型: Apache 2.0
- 许可证文件: LICENSE

中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
Nexdata/chinese_dialect
该数据集包含25,000小时的中文方言语音数据,收集自多个方言区域的本地方言使用者,涵盖闽南语、粤语、四川话、河南话、东北话、上海话、维吾尔语和藏语等。数据格式为16kHz、16bit、未压缩的wav文件,单声道。句子准确率超过95%。数据集支持的任务包括自动语音识别(ASR)和音频说话人识别。
hugging_face 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
Wafer Defect
该数据集包含了七个主要类别的晶圆缺陷,分别是:BLOCK ETCH、COATING BAD、PARTICLE、PIQ PARTICLE、PO CONTAMINATION、SCRATCH和SEZ BURNT。这些类别涵盖了晶圆在生产过程中可能出现的多种缺陷类型,每一种缺陷都有其独特的成因和表现形式。数据集不仅在类别数量上具有多样性,而且在样本的多样性和复杂性上也展现了其广泛的应用潜力。每个类别的样本均经过精心标注,确保了数据的准确性和可靠性。
github 收录