FrameNet|自然语言处理数据集|语言学数据集
收藏
- FrameNet项目正式启动,由加州大学伯克利分校的计算机科学家和语言学家共同发起,旨在通过语义框架来分析和标注自然语言。
- FrameNet发布了首个版本,包含了对英语中部分词汇的框架标注,标志着该数据集的初步形成。
- FrameNet首次在计算语言学协会(ACL)会议上公开展示,引起了学术界的广泛关注。
- FrameNet 1.5版本发布,增加了更多的语义框架和词汇标注,数据集的规模和覆盖范围显著扩大。
- FrameNet 1.6版本发布,引入了新的标注工具和方法,进一步提升了数据集的质量和可用性。
- FrameNet 1.7版本发布,开始支持多语言扩展,为跨语言研究提供了新的可能性。
- FrameNet 1.8版本发布,增加了对更多语言的支持,并改进了数据集的结构和标注一致性。
- FrameNet 2.0版本发布,引入了新的框架类型和更复杂的语义关系,数据集的深度和广度进一步提升。
- FrameNet 2.1版本发布,增加了对更多语言和领域的支持,数据集的应用范围进一步扩大。
- FrameNet 2.2版本发布,引入了新的标注标准和工具,数据集的标注质量和一致性得到显著提升。
- 1FrameNet: A Knowledge Base for Natural Language ProcessingInternational Computer Science Institute (ICSI) · 2000年
- 2FrameNet II: Extended Theory and PracticeUniversity of California, Berkeley · 2013年
- 3FrameNet as a Resource for Sentiment AnalysisUniversity of Antwerp · 2015年
- 4FrameNet-Based Semantic Role LabelingUniversity of Sheffield · 2017年
- 5FrameNet and Deep Learning: A Synergistic ApproachUniversity of Cambridge · 2020年
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
Eurovision Song Contest Dataset
Eurovision Song Contest数据集是一个免费提供的数据集,包含1735首参赛歌曲的音频特征、元数据、比赛排名和投票数据,这些歌曲参与了从1956年到2023年的Eurovision Song Contest。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录