使用大模型+CoT 方法抽取文本中的不动产实体以及实体关系
收藏江苏数据交易所2026-01-30 收录
下载链接:
https://exchange.jsdataex.com/trade-home/#/project/tradingMarket/productDetail?productId=1093
下载链接
链接失效反馈官方服务:
资源简介:
使用大模型+CoT 方法,抽取文本中的不动产实体以及实体关系,建立了全 国数据维度最全的楼盘大字典,解决异构数据中的语义歧义和不一致问题。通过 自主研发 NLP 技术,解决了小区名字和地址数据清洗、分词、实体识别、关系抽 取等自然语言理解中的难题。
提供机构:
苏州市中地行信息技术有限公司
搜集汇总
背景与挑战
背景概述
该数据集采用大模型结合思维链(CoT)方法,专注于从文本中抽取不动产实体及其关系,构建了全国数据维度最全的楼盘大字典,以有效解决异构数据中的语义歧义和不一致问题。通过自主研发的自然语言处理技术,它成功攻克了小区名字和地址的数据清洗、分词、实体识别及关系抽取等关键挑战,提升了自然语言理解的准确性和效率。
以上内容由遇见数据集搜集并总结生成



