DSGram-Eval, DSGram-LLMs|语法错误纠正数据集|大型语言模型评估数据集
收藏DSGram 数据集
数据集概述
DSGram 数据集是为评估和开发语法错误纠正(GEC)模型而设计的,特别是在大规模语言模型(LLMs)时代。该数据集通过结合人工标注和LLM生成的评分,解决了关键的评估挑战。数据集包含两个子集:
- DSGram-LLMs:一个模拟数据集,包含由GPT-4标注的句子对,用于GEC模型的微调和成本效益评估。
- DSGram-Eval:一个手动标注的数据集,提供高质量的人工评分示例,用于基准测试DSGram框架。
数据集支持基于以下三个子指标的修正评估:
- 语义一致性:保留原始含义。
- 编辑级别:修改的适当性。
- 流畅性:语法正确性和自然流畅性。
数据集结构
DSGram-LLMs
- 输入:来自CoNLL-2014和BEA-2019测试集的原始和修正句子。
- 标注:由GPT-4使用提示工程技术(Chain-of-Thought, few-shot prompting)生成的评分。
- 大小:约2,500条数据。
DSGram-Eval
- 输入:来自CoNLL-2014的句子。
- 标注:基于三个子指标的人工评分句子对,多个标注者以确保一致性。
- 大小:约200条数据。
数据集用途
预期用途
- 微调开源LLMs以进行GEC评估。
- 使用稳健且上下文敏感的指标基准测试GEC模型。
- 研究文本修正任务的评估框架。
引用
如果使用这些数据集,请引用相关论文。

学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录
Fruits-360
一个高质量的水果图像数据集,包含多种水果的图像,如苹果、香蕉、樱桃等,总计42345张图片,分为训练集和验证集,共有64个水果类别。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录