five

Hygros-LCA/IFC-Bridge-LCA-KBOB

收藏
Hugging Face2026-04-18 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Hygros-LCA/IFC-Bridge-LCA-KBOB
下载链接
链接失效反馈
官方服务:
资源简介:
--- license: mit language: - de - en task_categories: - text-ranking - sentence-similarity --- # Dataset Card — Queries for IFC‑KBOB AI Matcher Kurzbeschreibung Dieses Verzeichnis enthält zwei Plain‑Text‑Dateien mit generierten Queries und Material‑Mappings, verwendet für Training und Evaluation von BAAI/bge-3. Das trainierte Modell ist Hygroskopisch/bge-m3-ifc-kbob-finetuned. - queries.txt: einzelne Suchanfragen, eine Zeile pro Query. - mapping: gruppierte Material‑Alternativen pro Zeile, getrennt mit ` | `. Dataset Details Zweck - Trainieren und Evaluieren von Modellen zur Bauteil‑/Materialerkennung (z. B. SBERT, BGE). Nutzung für Hard‑Negative‑Mining, Mapping‑Tests und Retrieval‑Benchmarks. Format - Plain‑text UTF‑8, eine Zeile pro Eintrag. Erstellung & Herkunft - Generiert durch die Query‑Generierungskomponente des Repos [Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher) (Training/query_generation). - Kombiniert IFC‑Entity‑Typen, Materialklassen, Festigkeitsklassen (z. B. C30/37), NPK/Kürzel und Synonyme. Lizenz - MIT (siehe Frontmatter). Persönliche Daten - Keine personenbezogenen Daten enthalten. Einschränkungen & Risiken - Domänenspezifisch; enthält projekt‑spezifische Kürzel und mögliche Tippfehler. Vor produktivem Einsatz prüfen. Beispielnutzung (Python) ```python with open("generated_queries.txt","r",encoding="utf-8") as f: queries=[l.strip() for l in f if l.strip()] with open("mapping_generated_queries.txt","r",encoding="utf-8") as f: mappings=[[s.strip() for s in l.split("|")] for l in f if l.strip()] print(len(queries), "queries;", len(mappings), "mapping lines") ``` Kontakt & Zitation - Projekt: [Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher) (GitHub). Bitte Repo und Projekt als Quelle nennen.

许可证:MIT协议 支持语言: - 德语 - 英语 任务类别: - 文本排序 - 句子相似度 # 数据集卡片 — IFC-KBOB AI匹配器查询集 ## 简短描述 本目录包含两份纯文本文件,内含生成式查询与材料映射表,用于BAAI/bge-3的训练与评估。所微调得到的模型为Hygroskopisch/bge-m3-ifc-kbob-finetuned。 - queries.txt:单个搜索查询,每行对应一条查询。 - 映射表文件:每行存储一组分组后的材料替代项,各替代项以` | `分隔。 ## 数据集详情 ### 用途 用于训练与评估构件/材料识别模型(如SBERT、BGE),可应用于难负样本挖掘、映射测试及检索基准评测。 ### 格式 纯文本UTF-8编码,每行对应一条条目。 ### 创建与来源 - 由仓库[Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher)的查询生成组件(路径为training/query_generation)生成。 - 组合了IFC实体类型、材料类别、强度等级(如C30/37)、NPK缩写及同义词。 ### 许可证 MIT协议(详见前置元数据)。 ### 个人数据 本数据集未包含任何个人身份信息。 ### 限制与风险 该数据集为领域专用数据集,包含项目专属缩写及潜在拼写错误,投入生产环境使用前请进行校验。 ### 示例用法(Python) python with open("generated_queries.txt","r",encoding="utf-8") as f: queries=[l.strip() for l in f if l.strip()] with open("mapping_generated_queries.txt","r",encoding="utf-8") as f: mappings=[[s.strip() for s in l.split("|")] for l in f if l.strip()] print(len(queries), "条查询;", len(mappings), "条映射行") ## 联系与引用 - 项目仓库:[Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher)(GitHub)。请引用该仓库及项目作为数据源。
提供机构:
Hygros-LCA
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作