Studienfächer mit den meisten Studierenden 2023/2024|教育统计数据集|学科选择数据集
收藏BaiJia
BaiJia是一个由中国北京邮电大学创建的大规模历史角色扮演数据集,旨在为大语言模型提供低资源的历史角色扮演数据。该数据集包含19281个中国历史人物的信息,涵盖了唐、宋、元、明、清五个朝代。数据集的内容包括人物的传记、文学作品、家庭关系、历史事件等,数据来源广泛,包括历史文献、古籍、艺术作品、民间传说和口述传统。数据集的创建过程包括从多个来源收集人物简历、生成对话以及构建评估问题。该数据集的应用领域主要是增强大语言模型在历史角色扮演任务中的表现,旨在解决历史文本碎片化和多模态数据整合的挑战。
arXiv 收录
中国劳动力动态调查
“中国劳动力动态调查” (China Labor-force Dynamics Survey,简称 CLDS)是“985”三期“中山大学社会科学特色数据库建设”专项内容,CLDS的目的是通过对中国城乡以村/居为追踪范围的家庭、劳动力个体开展每两年一次的动态追踪调查,系统地监测村/居社区的社会结构和家庭、劳动力个体的变化与相互影响,建立劳动力、家庭和社区三个层次上的追踪数据库,从而为进行实证导向的高质量的理论研究和政策研究提供基础数据。
中国学术调查数据资料库 收录
alpacaGPT4_llama8b-v120-jb-seed2-alpaca_512_ngt0.7_tp0.9
该数据集包含了用户和助手之间的对话,具有用户和助手发言的文本特征,以及一个索引级别特征。数据集分为训练集,共有52001条对话记录。
huggingface 收录
RETQA
RETQA是由北京师范大学创建的第一个大规模开放领域中文表格问答数据集,专门针对房地产领域。该数据集包含4932个表格和20762个问答对,涵盖16个子领域,涉及房产信息、房地产公司财务信息和土地拍卖信息。数据集通过从中国八个主要城市的公开数据源收集并清洗整理,每个表格都配有摘要标题以辅助检索。RETQA的创建过程包括表格收集、问答对生成、意图和槽标签注释以及查询重写和质量控制。该数据集主要用于解决房地产领域的开放域和长表格问答问题,推动表格问答技术的发展。
arXiv 收录
电商直播间互动率数据评价检测数据
1.了解观众兴趣和需求:通过分析互动率数据,商家可以了解观众对直播内容和商品的兴趣和需求,从而调整直播策略和商品陈列方式,提高观众的购买转化率。 2.评估主播能力和带货效果:互动率数据可以用来评估主播的能力和带货效果。如果一个主播能够有效地引导观众互动,可能说明该主播的能力较强。商家可以根据互动率数据来评估不同主播的能力和带货效果,从而更好地选择合作对象。 3.检测数据真实性:互动率数据可以反映观众在直播间中的真实活跃度和参与度,帮助商家检测数据的真实性。如果互动率数据与实际数据存在较大偏差,可能说明数据存在异常或问题,商家需要进一步调查和处理,以保障市场的公平和公正。 4.发现潜在问题:通过分析互动率数据,商家可以发现直播间中可能存在的问题。 5.优化售后服务:如果一个直播间的互动率很低,可能说明观众在购买商品后遇到了一些问题,商家需要优化售后服务,提高客户满意度和忠诚度。数据处理:将收集到的各电商直播间互动率数据进行归集,将电商直播间互动率数据计算数值与电商直播间互动率数据评定标准值对比判定该电商直播间互动率是否达标,(互动人数/进房人数*100%=互动率),互动率标准数值的确定方式:结合该直播类型、直播类型和观众画像等因素综合考虑得出互动率的标准数值,为50%,当计算数值大于标准数值时互动率达标,当计算数值小于标准数值时互动率不达标
浙江省数据知识产权登记平台 收录