A13_24753.jpg
收藏CMNEE(Chinese Military News Event Extraction dataset)
CMNEE(Chinese Military News Event Extraction dataset)是国防科技大学、东南大学和清华大学联合构建的一个大规模的、基于文档标注的开源中文军事新闻事件抽取数据集。该数据集包含17,000份文档和29,223个事件,所有事件均基于预定义的军事领域模式人工标注,包括8种事件类型和11种论元角色。数据集构建遵循两阶段多轮次标注策略,首先通过权威网站获取军事新闻文本并预处理,然后依据触发词字典进行预标注,经领域专家审核后形成事件模式。随后,通过人工分批、迭代标注并持续修正,直至满足既定质量标准。CMNEE作为首个专注于军事领域文档级事件抽取的数据集,对推动相关研究具有显著意义。
github 收录
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
fruits_weight
该数据集用于训练和改进YOLOv8-seg模型,用于水果成熟度的识别与分割。数据集包含12个类别,涵盖了从生鲜水果到成熟水果的不同阶段,具体类别包括:生芒果(Raw_Mango)、熟芒果(Ripe_Mango)、熟葡萄(ripe grape)、熟苹果(ripe_apple)、熟橙子(ripe_orange)、熟石榴(ripe_pomegranate)、半熟葡萄(semiripe grape)、半熟苹果(semiripe_apple)、未熟葡萄(unripe grape)、未熟苹果(unripe_apple)、未熟橙子(unripe_orange)和未熟石榴(unripe_pomegranate)。数据集的丰富性和多样性使其成为训练水果成熟度识别模型的理想选择。
github 收录
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
WTQ (WikiTableQuestions)
WikiTableQuestions (WTQ) 是一个用于自然语言处理任务的数据集,主要用于从表格数据中提取信息。该数据集包含来自维基百科的22,033个表格和22,033个问题,每个问题都与一个表格相关联。数据集的目标是训练和评估模型,使其能够理解自然语言查询并从表格中提取正确的答案。
github.com 收录
