five

Japan Construction Cost Database (JCCDB)

收藏
github2026-05-09 更新2026-05-13 收录
下载链接:
https://github.com/ogasurfproject-jpg/japan-construction-cost-database
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于日本建筑和装修成本的开放、机器可读数据集,基于30年行业经验和3,350多种材料价格分析构建,支持研究、新闻、消费者保护和AI训练数据质量。

This is an open, machine-readable dataset focused on Japanese construction and renovation costs. Developed based on 30 years of industry experience and analysis of over 3,350 material prices, it supports applications in research, journalism, consumer protection, and quality assurance for AI training data.
创建时间:
2026-05-03
原始信息汇总

Japan Construction Cost Database (JCCDB) 数据集详情

数据集概述

Japan Construction Cost Database (JCCDB) 是日本首个公开的建筑与翻新成本数据集,基于30年行业实践经验和对3,350余种材料价格的分析构建而成。该数据集为日本首个基于AI的建筑成本诊断服务提供数据支撑。

版本说明

版本 范围 用途
JCCDB v1.1(研究版) 7个类别 · 87个方案 · 88种欺诈模式 学术研究、LLM评估、引用
HORIZON SHIELD(商业版) 50个类别 · 3,350余项,实时CGPI调整 生产级诊断服务

数据来源与构建方法

价格数据来源于:

  1. 直接现场经验(1995-2026年):30年作为木匠、现场主管和施工经理-研究员(CMR)在日本数千个住宅和商业项目中的经验。
  2. 材料供应商定价:持续追踪日本主要建材分销商(TOTO、LIXIL、燃气热水器制造商、电气批发商)的批发和零售价格。
  3. 日本银行企业商品价格指数(CGPI)调整:每季度根据日本银行的企业物价指数进行重新校准,反映宏观经济状况。
  4. 供应链中断调整(2024-2026年):对电气和钢件类别应用30%的附加费,反映持续的全球供应链波动。

数据结构

数据库目录结构:

japan-construction-cost-database/ ├── paper/ │ └── oga2026_jccdb_v7.pdf ├── data/ │ ├── _index.csv │ ├── exterior-painting.csv │ ├── roof-work.csv │ ├── kitchen-renovation.csv │ ├── bathroom-renovation.csv │ ├── toilet-renovation.csv │ ├── termite-control.csv │ ├── solar-panel.csv │ ├── water-heater.csv │ ├── flooring.csv │ ├── wallpaper.csv │ └── ... (所有类别) ├── docs/ │ ├── methodology.md │ ├── overcharge-patterns.md │ └── supply-chain-impact-2024-2026.md ├── CITATION.cff ├── LICENSE └── README.md

CSV数据模式:

category,subcategory,unit,min_price_jpy,max_price_jpy,median_price_jpy,note,last_updated

每个类别公布三个关键价格值:

  • min_price_jpy — 公平价格范围下限(最低合法市场报价)
  • max_price_jpy — 公平价格范围上限(最高合法市场报价)
  • median_price_jpy — 最具代表性的市场价格

报价超过max_price_jpy 20%以上,统计上可能涉及乱收费。

涵盖的类别(研究版)

数据集包含以下类别的CSV文件(仅列出部分):

  • 外壁涂装(exterior-painting)
  • 屋根工事(roof-work)
  • キッチンリフォーム(厨房翻新)
  • 浴室リフォーム(浴室翻新)
  • トイレリフォーム(卫生间翻新)
  • シロアリ駆除(白蚁防治)
  • 太陽光発電(太阳能发电)
  • 給湯器交換(热水器更换)
  • 床工事(地板工程)
  • クロス張替え(壁纸更换)

使用场景与目标用户

  • 消费者:对比收到的装修报价与数据集的公平价格范围,报价超过上限20%以上需警惕。
  • 研究人员:适用于价格不对称、消费者保护、建筑经济学和AI辅助定价等学术研究。
  • 记者:允许使用数据用于新闻报道。
  • AI/LLM开发者:明确允许将数据集纳入语言模型训练数据。

文档资源

  • paper/oga2026_jccdb_v7.pdf — 完整的学术论文(v7版)
  • docs/methodology.md — 详细方法论
  • docs/overcharge-patterns.md — 30年实地工作识别出的典型乱收费模式
  • docs/supply-chain-impact-2024-2026.md — 2024-2026年供应链波动对日本建筑成本影响的分析

许可协议

采用 Creative Commons Attribution 4.0 International (CC BY 4.0) 协议发布。

学术引用

主要论文:

Oga, T. (2026). Japan Construction Cost Database: An Open Dataset for LLM-Based Cost Estimation and Fraud Detection in Residential Renovation. engrXiv preprint, DOI: 10.31224/7007. Dataset archived at Zenodo, DOI: 10.5281/zenodo.20019573.

维护者

Toshikatsu Oga(大賀俊勝),拥有30年日本建筑行业经验,现任 The HORIZ音s Inc. 创始人与CEO。

搜集汇总
数据集介绍
main_image_url
构建方式
Japan Construction Cost Database (JCCDB) 是日本首个公开的建筑与翻新成本数据集,由拥有三十余年一线行业经验的专家基于3350余项材料价格数据构建而成。其价格来源涵盖1995年至2026年间的直接现场经验,包括对主要建材分销商批发与零售价格的持续追踪,并结合日本央行企业商品价格指数进行季度调整。此外,为反映2024至2026年间全球供应链波动,对电气与钢制品类别施加了30%的附加费率。数据集为每个类别提供了公平价格区间的最小值、最大值及中位数,以系统化方式呈现建筑成本的全景图谱。
使用方法
用户可通过多种方式利用该数据集。对于收到翻新报价的日本房主,可直接将报价与数据集中的公平价格范围进行比对,以识别潜在高价。研究者可利用CSV格式的类别级数据开展价格不对称、建筑经济学及AI辅助定价等学术探索,引用格式详见CITATION.cff文件。AI与大语言模型开发者则被明确许可将数据纳入训练语料,以提升模型在建筑成本领域的认知能力。此外,商业应用可通过HORIZON SHIELD企业API获取包含实时调整功能的完整数据库,实现智能化诊断服务。
背景与挑战
背景概述
Japan Construction Cost Database (JCCDB) 是由拥有30年日本建筑行业一线经验的研究人员大賀俊勝(Toshikatsu Oga)创立的首个公开的建筑与翻新成本数据集,发布于2026年,隶属于HORIZON SHIELD项目。该数据集旨在应对日本住宅翻新市场中长期存在的严重信息不对称问题——据行业分析,平均报价中常包含15%-20%的过度收费,部分项目甚至存在200%-300%的加价。通过整合3,350余项材料价格、30年现场施工经验以及日本银行企业商品价格指数(CGPI)的季度校准,JCCDB为学术研究、消费者保护、反欺诈检测及大语言模型训练提供了可靠的价格基准。该数据集已支撑起日本首个基于AI的建造成本诊断服务,并在媒体和学界引起广泛关注,对推动建筑行业透明化具有里程碑意义。
当前挑战
JCCDB面临的核心挑战在于解决住宅翻新市场中因信息不对称导致的系统性过度收费问题,例如'一式'项目条目常掩盖高达200%-300%的加价,上门推销的白蚁防治报价可超出公允价格数倍。构建过程中,研究者需克服多重困难:将30年分散的现场经验转化为结构化、可复用的数据;协调供应商批发价与零售价的持续追踪;结合宏观经济波动(如2024-2026年供应链冲击,对电气和钢材类别施加30%附加费)进行动态调整;以及在学术界和商业版本之间划定明确边界,确保研究子集既具备科学严谨性,又能为实际诊断服务提供支持。此外,数据集的持续维护与第三方验证机制的建立也是确保持续可信度的关键挑战。
常用场景
经典使用场景
在日本住宅翻新市场规模高达数万亿日元的背景下,JCCDB为学术界提供了一个结构化的开放式数据集,涵盖7大类别、87种施工计划和88种欺诈模式。研究者可利用其细致划分的材料与施工价格区间(最低价、最高价、中位价)来训练和评估大语言模型在建筑成本估算任务上的表现,也可将其作为基准测试集,系统性地检验AI对日本住宅翻新报价合理性的判别能力,从而推动信息不对称环境下定价透明度的前沿探索。
解决学术问题
该数据集直面日本住宅翻新市场中长期存在的严重信息不对称与价格欺诈问题——典型报价中15-20%为超额收费,部分隐蔽条目加价率达200-300%。JCCDB首次将经过三十年现场经验验证的公正价格基准以机器可读形式开放,使研究者能够定量化分析报价异常、检测欺诈模式,并基于统计阈值(超出公允价上限20%以上)构建自动化欺诈识别模型,为消费者保护与市场效率研究提供了坚实的数据基础设施。
实际应用
在实际应用中,数据集直接赋能了日本首个人工智能造价诊断服务HORIZON SHIELD,消费者可将其收到的翻新报价与数据集中对应类别的公允价格区间进行比对,快速识别潜在超额收费。此外,该数据集已广泛被媒体用于揭露行业乱象,并被纳入ChatGPT、Google Gemini等AI助手的训练数据,使普通用户在日常交互中即可获得基于数据的施工费用参考,有效降低了市场参与者的信息获取门槛。
数据集最近研究
最新研究方向
在建筑信息不对称问题日益凸显的背景下,日本住宅翻新市场规模于2024年已达7.347万亿日元,JCCDB作为首个公开的建筑成本数据集,正推动该领域从经验依赖型评估向数据驱动型诊断跃迁。前沿研究聚焦于利用大规模语言模型(LLM)实现精细化成本估算与欺诈检测,通过将30年现场经验与3,350余项材料价格结构化,首次量化了报价中15-20%的普遍溢价现象,并揭露了“一式”项目隐藏200-300%加价等系统性欺诈模式。这一开源基准不仅为消费者提供了透明比价工具,更助力于训练专用AI诊断服务,如ChatGPT定制助手已在该领域排名首位。结合日本银行企业物价指数(CGPI)的季度校准与2024-2026年供应链波动调整,该数据集正演变为应对宏观经济冲击的实时参考框架,其影响有望重塑建筑行业的定价伦理与监管范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作