five

Identifying Interesting Web Pages(识别有趣的网页)

收藏
阿里云天池2026-06-09 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/88673
下载链接
链接失效反馈
官方服务:
资源简介:
This database contains HTML source of web pages plus the ratings of a single user on these web pages. Web pages are on four seperate subjects (Bands- recording artists; Goats; Sheep; and BioMedical) 该数据库包含网页的HTML源以及单个用户在这些网页上的评级。网页上有四个不同的主题(乐队-唱片艺术家;山羊;羊;和生物医学)。

本数据库包含网页的HTML源代码,以及单个用户对这些网页的评级数据。所收录网页涵盖四大独立主题:乐队——录音艺术家、山羊、绵羊与生物医学。
提供机构:
阿里云天池
创建时间:
2021-01-19
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含网页的HTML源代码及单个用户的评级,评级基于热、中、冷三个等级,覆盖乐队、山羊、羊和生物医学四个主题领域。数据以文件形式存储,每个主题有独立目录和索引文件,用于预测用户对网页的兴趣程度。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务