PaSa
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/PaSa
下载链接
链接失效反馈官方服务:
资源简介:
PaSa 是一个数据集,用于训练机器学习算法以自动突出显示带有语义注释的专利段落。它由 15 万个样本组成,这些样本是通过十年来遍历 USPTO 专利获得的
提供机构:
OpenDataLab
创建时间:
2022-06-28
搜集汇总
数据集介绍

背景与挑战
背景概述
PaSa是一个专为训练机器学习算法设计的数据集,旨在自动突出显示带有语义注释的专利段落。它包含15万个样本,数据来源于十年间的USPTO专利,由帕绍大学·BETTEN & RESCH于2021年发布。
以上内容由遇见数据集搜集并总结生成



