five

价值观内容类别标签数据集

收藏
国家基础学科公共科学数据中心2026-01-30 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=67d50dba195d260905af9713&type=1
下载链接
链接失效反馈
官方服务:
资源简介:
价值观内容类别标签数据集主要面向主流价值观特征提取与内容识别研究、模型训练需求建设,基于国内主流新闻平台的真实新闻数据和基于现有标签词生成的虚拟新闻数据产生,主要记录了新闻文本片段及其对应的价值观标签词等数据,数据量约190,722条。其中,raw_data.json包含人工筛查的14,535条新闻文本片段,涵盖新闻、军事、财经、科技、文化等多个领域,每条数据包含“Instruction”和“output”两个字段,分别对应文本数据和抽取到的标签词;infer_data.json则包含176,187条新闻文本,用于模型推理阶段。该数据集通过结合真实与虚拟数据,确保了数据的丰富性和代表性,为构建高精度的价值观内容识别模型提供了坚实基础。
提供机构:
哈尔滨工业大学
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集面向主流价值观特征提取与内容识别研究与模型训练,基于真实与虚拟新闻数据构建,包含约19万条记录,涵盖多个领域。数据分为人工筛查的文本片段和用于推理的新闻文本,为价值观内容识别模型提供了丰富且具代表性的基础。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务