SALT: Sales Autocompletion Linked Business Tables Dataset
收藏SALT: Sales Autocompletion Linked Business Tables Dataset
描述
该仓库将包含数据和代码,用于我们的论文SALT: Sales Autocompletion Linked Business Tables Dataset,该论文将在NeurIPS24 Table Representation Workshop上展示。
摘要
基础模型,特别是那些结合了Transformer架构的模型,在自然语言处理和图像处理等领域表现出色。然而,将这些模型适应于结构化数据(如表格)时,会引入重大挑战。当处理通过外键链接的多表数据时,这些困难更加明显,这在企业领域中非常普遍,对于支持业务用例至关重要。尽管其影响巨大,但针对企业环境中此类链接业务表格的研究仍然是一个重要且未被充分探索的领域。 为了解决这一问题,我们引入了一个从企业资源规划(ERP)系统中提取的精心策划的数据集,该数据集包含广泛的链接表格。该数据集专门设计用于支持表格表示学习的研究工作。通过提供真实的企业数据访问权限,我们的目标是潜在地提高模型在现实世界业务场景中的有效性和适用性。
信息
SALT数据集的表格模式
使用SAP S4/HANA的销售订单应用程序的示例输入掩码
已知问题
无已知问题
引用
如果您在研究中使用此代码或希望引用我们的工作,请引用:
@inproceedings{ klein2024salt, title={{SALT}: Sales Autocompletion Linked Business Tables Dataset}, author={Tassilo Klein and Clemens Biehl and Margarida Costa and Andre Sres and Jonas Kolk and Johannes Hoffart}, booktitle={NeurIPS 2024 Third Table Representation Learning Workshop}, year={2024}, url={https://openreview.net/forum?id=UZbELpkWIr} }
路线图
- [ ] 发布数据集
如何获取支持
如果您发现错误或有关于内容的问题,请在此仓库中创建一个问题。
贡献
如果您希望贡献代码、提供修复或改进,请发送拉取请求。由于法律原因,贡献者在创建第一个拉取请求时将被要求接受DCO。这将在提交过程中自动进行。SAP使用Linux基金会的标准DCO文本。
许可证
版权所有 (c) 2024 SAP SE 或 SAP 关联公司。保留所有权利。本项目根据 CC-BY-NC-SA 软件许可证版本 4.0 授权,除非在 LICENSE 文件中另有说明。




