five

园林绿化合同结构化语义数据集

收藏
江苏数据交易所2026-04-02 更新2026-03-21 收录
下载链接:
https://exchange.jsdataex.com/trade-home/#/project/tradingMarket/productDetail?productId=6412
下载链接
链接失效反馈
官方服务:
资源简介:
本产品基于历年园林合同,运用 LlamaIndex 抽象语法树切分(AST Chunking)与 LLM 进行多维度语义实体识别(NER)及逻辑关系抽取,实现非结构化文本到高维结构化资产的转化。旨在为垂直法务大模型提供监督微调(SFT)标准指令集,并作为检索增强生成(RAG)架构的底层特征向量语料库。
提供机构:
泰州市润森园艺有限公司
创建时间:
2026-03-18
搜集汇总
背景与挑战
背景概述
该数据集专注于园林绿化合同领域,通过结合LlamaIndex抽象语法树切分和大语言模型技术,实现了对非结构化合同文本的语义实体识别与逻辑关系抽取,从而转化为高维结构化资产。它旨在为垂直法务大模型提供监督微调的标准指令集,并作为检索增强生成架构的底层特征向量语料库,以支持法务AI应用的训练与优化。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作