Webis-Web-Errors-19
收藏webis.de2025-01-15 收录
下载链接:
https://webis.de/data/Webis-Web-Errors-19
下载链接
链接失效反馈官方服务:
资源简介:
The Webis-Web-Errors-19 comprises various annotations for the 10,000 web page archives of the Webis-Web-Archive-17. The annotations are whether the page is (1) mostly advertisement, (2) cut off, (3) still loading, (4) pornographic; and whether it shows (not/a bit/ very) (5) pop-ups, (6) CAPTCHAs, or (7) error messages.
Webis-Web-Errors-19数据集包含了Webis-Web-Archive-17中的10,000个网页存档的多种标注。标注内容涵盖页面是否(1)主要包含广告、(2)截断、(3)正在加载、(4)色情;以及页面是否显示(无/略微/非常)(5)弹出窗口、(6)验证码或(7)错误信息。
提供机构:
Webis Group



