Hygros-LCA/IFC-Bridge-LCA-KBOB
收藏Hugging Face2026-04-18 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Hygros-LCA/IFC-Bridge-LCA-KBOB
下载链接
链接失效反馈官方服务:
资源简介:
---
license: mit
language:
- de
- en
task_categories:
- text-ranking
- sentence-similarity
---
# Dataset Card — Queries for IFC‑KBOB AI Matcher
Kurzbeschreibung
Dieses Verzeichnis enthält zwei Plain‑Text‑Dateien mit generierten Queries und Material‑Mappings, verwendet für Training und Evaluation von BAAI/bge-3.
Das trainierte Modell ist Hygroskopisch/bge-m3-ifc-kbob-finetuned.
- queries.txt: einzelne Suchanfragen, eine Zeile pro Query.
- mapping: gruppierte Material‑Alternativen pro Zeile, getrennt mit ` | `.
Dataset Details
Zweck
- Trainieren und Evaluieren von Modellen zur Bauteil‑/Materialerkennung (z. B. SBERT, BGE). Nutzung für Hard‑Negative‑Mining, Mapping‑Tests und Retrieval‑Benchmarks.
Format
- Plain‑text UTF‑8, eine Zeile pro Eintrag.
Erstellung & Herkunft
- Generiert durch die Query‑Generierungskomponente des Repos [Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher) (Training/query_generation).
- Kombiniert IFC‑Entity‑Typen, Materialklassen, Festigkeitsklassen (z. B. C30/37), NPK/Kürzel und Synonyme.
Lizenz
- MIT (siehe Frontmatter).
Persönliche Daten
- Keine personenbezogenen Daten enthalten.
Einschränkungen & Risiken
- Domänenspezifisch; enthält projekt‑spezifische Kürzel und mögliche Tippfehler. Vor produktivem Einsatz prüfen.
Beispielnutzung (Python)
```python
with open("generated_queries.txt","r",encoding="utf-8") as f:
queries=[l.strip() for l in f if l.strip()]
with open("mapping_generated_queries.txt","r",encoding="utf-8") as f:
mappings=[[s.strip() for s in l.split("|")] for l in f if l.strip()]
print(len(queries), "queries;", len(mappings), "mapping lines")
```
Kontakt & Zitation
- Projekt: [Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher) (GitHub). Bitte Repo und Projekt als Quelle nennen.
许可证:MIT协议
支持语言:
- 德语
- 英语
任务类别:
- 文本排序
- 句子相似度
# 数据集卡片 — IFC-KBOB AI匹配器查询集
## 简短描述
本目录包含两份纯文本文件,内含生成式查询与材料映射表,用于BAAI/bge-3的训练与评估。所微调得到的模型为Hygroskopisch/bge-m3-ifc-kbob-finetuned。
- queries.txt:单个搜索查询,每行对应一条查询。
- 映射表文件:每行存储一组分组后的材料替代项,各替代项以` | `分隔。
## 数据集详情
### 用途
用于训练与评估构件/材料识别模型(如SBERT、BGE),可应用于难负样本挖掘、映射测试及检索基准评测。
### 格式
纯文本UTF-8编码,每行对应一条条目。
### 创建与来源
- 由仓库[Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher)的查询生成组件(路径为training/query_generation)生成。
- 组合了IFC实体类型、材料类别、强度等级(如C30/37)、NPK缩写及同义词。
### 许可证
MIT协议(详见前置元数据)。
### 个人数据
本数据集未包含任何个人身份信息。
### 限制与风险
该数据集为领域专用数据集,包含项目专属缩写及潜在拼写错误,投入生产环境使用前请进行校验。
### 示例用法(Python)
python
with open("generated_queries.txt","r",encoding="utf-8") as f:
queries=[l.strip() for l in f if l.strip()]
with open("mapping_generated_queries.txt","r",encoding="utf-8") as f:
mappings=[[s.strip() for s in l.split("|")] for l in f if l.strip()]
print(len(queries), "条查询;", len(mappings), "条映射行")
## 联系与引用
- 项目仓库:[Hygros/ifc-kbob-ai-matcher](https://github.com/Hygros/ifc-kbob-ai-matcher)(GitHub)。请引用该仓库及项目作为数据源。
提供机构:
Hygros-LCA



