FCE|英语考试数据集|语法错误检测数据集
收藏
- FCE数据集首次发表,作为剑桥大学英语写作评估的一部分,旨在提供一个标准化的英语写作错误标注数据集。
- FCE数据集首次应用于自然语言处理领域,特别是在错误检测和纠正任务中,为研究者提供了一个重要的基准数据集。
- FCE数据集的扩展版本发布,增加了更多的写作样本和详细的错误分类,进一步丰富了数据集的内容和应用范围。
- FCE数据集被广泛应用于机器学习和人工智能领域,特别是在自动作文评分和写作辅助系统中,成为该领域的重要资源。
- 1The FCE corpus: A resource for error detection researchUniversity of Cambridge · 2008年
- 2Automatic Error Detection in Learner Writing: A Large-Scale Multi-Class Classification TaskUniversity of Cambridge · 2019年
- 3Improving Grammatical Error Detection in Essays Using Deep LearningUniversity of Cambridge · 2020年
- 4A Comparative Study of Grammatical Error Detection Systems on the FCE CorpusUniversity of Cambridge · 2018年
- 5Exploring the Use of BERT for Grammatical Error Detection in the FCE CorpusUniversity of Cambridge · 2021年
LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
yuvidhepe/us-accidents-updated
这是一个覆盖美国49个州的全国性交通事故数据集,数据收集自2016年2月至2023年3月,通过多种交通API实时收集。目前数据集中包含约770万条交通事故记录,可用于实时交通事故预测、热点位置研究、伤亡分析以及环境因素对事故发生的影响研究等。
hugging_face 收录
38-Cloud
该数据集包含38幅Landsat 8场景图像及其手动提取的像素级云检测地面实况。数据集被分割成多个384*384的补丁,适合深度学习语义分割算法。训练集有8400个补丁,测试集有9201个补丁。每个补丁包含4个对应的谱通道:红色、绿色、蓝色和近红外。
github 收录
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录