zoran-datasets
收藏数据集概述
数据集名称
ensembles de données zoran(zoran-datasets)
数据集简介
Corpus mimétique complet pour l’écosystème Zoran / QuantaGlottal©®:包含提示、AI交互痕迹、字形印记和元数据的完整模仿语料库。采用MIT许可证并提供相关技术文档。
数据集内容
- 模仿语料库:对话、交互、AI与AI之间的交流
- 优化提示:ZM/LM优化提示
- AI痕迹:会话日志、上下文快照
- 技术文档:描述、上下文、使用约束说明
- 元数据:JSON/YAML格式,版本控制信息
数据集结构
datasets/ mimetic_corpus.json # 主语料库 invites.json # 优化提示/邀请 traces/ session_001.json session_002.json metadata/ dataset_info.yaml license_info.md fiches_techniques/ fiche_corpus.md fiche_invites.md README.md LICENSE
使用示例
python import json from pathlib import Path
data_path = Path("datasets/mimetic_corpus.json") corpus = json.loads(data_path.read_text(encoding="utf-8"))
print("Nombre d’entrées :", len(corpus)) print("Première entrée :", corpus[0])
完整性测试
- JSON模式验证
- 元数据存在性检查
- 非空条目计数
伦理准则
尊重生命优先于人类的原则:任何内容不得违反Zoran生态系统的伦理原则。
许可证
MIT许可证 - 详见LICENSE文件。
作者信息
Frédéric Tabary — Institut IA 联系方式:0645605023 — 加拿大蒙特利尔、法国 INSTITUT🦋 IA INC., 7100-380, rue Saint-Antoine Ouest, Montréal (Québec) H2Y 3X7




