five

作文数据|教育数据集|作文教学数据集

收藏
北京国际大数据交易所2024-12-31 收录
教育
作文教学
下载链接:
https://webs.bjidex.com/sys-bsc-home/#/bscConsole/tradingMarket/detail?id=4021
下载链接
链接失效反馈
资源简介:
中小学作文数据产品,是教育领域极具价值的资源宝库,专为教育大模型训练及多种教育场景应用而精心打造。涵盖初中语文、初中英语以及小高(4 - 6 年级)语文的作文数据。在初中语文部分,精心准备了丰富多样的作文题目,涵盖记叙文、议论文等常见文体,且数量充足。每个题目均收集了来自大型联考中以班级为单位的大量学生作答,全面覆盖当地地市如河南中考作文评阅标准中的 1 类作文(50 - 45 分)到 6 类作文(0 - 10 分)的各个等级,为精准教学分析提供了丰富样本。题目与作答数据均保证字迹清晰、卷面整洁,以确保数据质量。初中英语方面,同样拥有数量可观的作文题目,每个题目也有来自班级为单位的众多学生作答,完整覆盖本地市中考评阅标准中的 1 类(1 - 5 分)到 4 类(16 - 20 分)等级。这些数据源于大型联考,优先选取字迹清晰、卷面整洁的作答,为英语作文教学研究与模型训练提供有力支撑。小高语文包含较多的作文题目,其中书信类也占有一定比例。每个题目拥有大量班级单位的学生作答,全面覆盖珠三角地区等当地评阅标准中的 A 类(27 - 30 分)到 D 类(18 分以下)等级。数据来自大型联考,注重字迹清晰与卷面整洁,助力小学高年级作文教学与研究。① 作文数据产品由“错题本”服务中,学生提供的答题卡进行匿名化加工后形成,不含个人信息。试题产品由“错题本”服务中老师上传的试题加工形成。②所附隐私政策在用户注册登录APP时由用户点击确认接受,已提示未成年人在成年人陪同下阅读。数据授权政策出现的场景是用户申请使用“错题本”功能时,试题和答题卡数据的加工使用已获完整授权。
提供机构:
安徽七天网络科技有限公司
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录