five

主流价值信息传播模型仿真数据集|信息传播数据集|机器学习数据集

收藏
国家基础学科公共科学数据中心2024-03-05 收录
信息传播
机器学习
下载链接:
https://www.nbsdc.cn/general/dataDetail?id=64edc99cbb16e07753c35c9f&type=1
下载链接
链接失效反馈
资源简介:
本数据集在Windows、Mac OS X、Linux操作系统下均可读取,可根据需求进一步设计信息传播模型来研究主流价值信息的传播规律。数据集中标题是新闻内容的高度浓缩,是用户点击及后续发生评论行为的重要文本特征。评论行为是新闻是否流行的重要体现。时间序列能够体现用户评论行为在时间维度上的演变规律,体现了新闻流行度的随时间的变化。利用新闻标题文本与时间序列信息结合深度神经网络技术可以实现主流价值信息的流行度预测任务。在实际应用中,将新闻标题输入至一维CNN获取标题的语义特征,将时间序列输入至循环神经网络获取新闻的序列信息特征,将获取的时间序列特征和语义特征注入到注意力单元中动态学习两者的权重,最后通过全连接层输出流行度预测的结果。
提供机构:
成都索贝数码科技股份有限公司
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

FEVER

FEVER(Fact Extraction and VERification)数据集是一个用于事实验证任务的数据集,包含超过185,000个标注的声明,这些声明需要从维基百科中提取证据进行验证。数据集的目标是帮助开发和评估自动事实验证系统。

fever.ai 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

NREL Wind Integration National Dataset (WIND) Toolkit

NREL Wind Integration National Dataset (WIND) Toolkit 是一个包含美国大陆风能资源和电力系统集成数据的综合数据集。该数据集提供了高分辨率的风速、风向、风能密度、电力输出等数据,覆盖了美国大陆的多个地理区域。这些数据有助于研究人员和工程师进行风能资源评估、电力系统规划和集成研究。

www.nrel.gov 收录