ACE 2005|自然语言处理数据集|事件抽取数据集
收藏
- ACE 2005数据集首次发布,作为自动内容抽取(Automatic Content Extraction, ACE)项目的一部分,旨在为自然语言处理领域的实体识别、关系抽取和事件抽取等任务提供标准化的训练和测试数据。
- ACE 2005数据集在多个国际会议和研讨会上被广泛讨论和应用,成为自然语言处理研究中的重要基准数据集之一。
- 随着深度学习技术的发展,ACE 2005数据集开始被用于训练和评估基于神经网络的实体识别和关系抽取模型,进一步推动了相关研究的发展。
- ACE 2005数据集在事件抽取任务中的应用取得了显著进展,多个研究团队基于该数据集提出了新的模型和方法,提升了事件抽取的准确性和效率。
- ACE 2005数据集的影响力进一步扩大,被纳入多个自然语言处理课程的教学内容,成为学生和研究人员学习和研究的重要资源。
- 随着预训练语言模型(如BERT)的兴起,ACE 2005数据集被用于微调这些模型,以提升其在实体识别、关系抽取和事件抽取任务中的表现。
- ACE 2005数据集继续在自然语言处理领域发挥重要作用,尽管新的数据集不断涌现,但其作为经典基准数据集的地位依然稳固。
- 1The Automatic Content Extraction (ACE) Program - Tasks, Data, and EvaluationLinguistic Data Consortium (LDC) · 2005年
- 2A Multi-Task Learning Framework for Multi-Target Stance Detection Using the ACE 2005 DatasetUniversity of California, Berkeley · 2020年
- 3Event Extraction from Text: A Survey of ACE 2005 Dataset and Its ApplicationsUniversity of Edinburgh · 2019年
- 4Cross-lingual Event Extraction Using ACE 2005 DatasetUniversity of Stuttgart · 2018年
- 5Improving Event Extraction with Cross-document Coherence: A Study on ACE 2005 DatasetUniversity of Maryland · 2017年
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
ChinaTravel
ChinaTravel是由南京大学国家重点实验室开发的一个真实世界基准数据集,专门用于评估语言代理在中国旅行规划中的应用。该数据集涵盖了中国10个最受欢迎城市的旅行信息,包括720个航班和5770趟列车,以及3413个景点、4655家餐厅和4124家酒店的详细信息。数据集通过问卷调查收集用户需求,并设计了一个可扩展的领域特定语言来支持自动评估。ChinaTravel旨在解决复杂的真实世界旅行规划问题,特别是在多兴趣点行程安排和用户偏好满足方面,为语言代理在旅行规划中的应用提供了重要的测试平台。
arXiv 收录