OWS_Based_网页爬取文档质量评分数据
收藏海数据2026-03-14 收录
下载链接:
https://haidatas.com/dataset/ows_based_wangyepaquwendangzhiliangpingfen_d925bcc7
下载链接
链接失效反馈官方服务:
资源简介:
本数据集包含OWS数据集的文档质量评分,基于QT5-small模型计算得出,与原数据集文件夹结构保持一致。评分文件按原元数据Parquet文件顺序对应,仅提供质量评分,不包含完整元数据文件。 论文“Document Quality Scoring for Web Crawling”
提供机构:
公开数据
创建时间:
2026-02-01



