five

Corpus of Turkish English Exam Scripts (TEES)|语言学习数据集|语料库研究数据集

收藏
Mendeley Data2024-03-27 更新2024-06-26 收录
语言学习
语料库研究
下载链接:
https://data.mendeley.com/datasets/72x973vn44
下载链接
链接失效反馈
资源简介:
The Turkish English Exam Scripts (TEES, hereafter) corpus is a learner corpus based on the exam scripts compiled by Akbas and Olcu-Dincer in 2019 at Erciyes University in Turkey for research purposes, which is expected to contribute to teaching plans and practices of L2 learners, especially for the Turkish ones, both in local and international contexts. Not only can the examination of TEES provide us a better understanding of the interlanguage issues (i.e. grammar, vocabulary choice) but also it can allow the practitioners and researchers aiming to develop materials and design tasks for language classes by taking performances of L2 users. The corpus includes ''136 exam scripts'' written by freshman Turkish speakers of English at tertiary level whose proficiency level ranges from intermediate to upper intermediate. The following 'rar file' includes all the texts with unique identification codes as well as two other subfolders: (1) Texts categorized by the exams (Midterm and Final) and (2) Texts categorized by the proficiency of learners in L2 Grammar class labelled as High Achievers, Mid Achievers, Low Achievers. To exemplify, the unique identification code M_HA_001_053 for a text refers to a Midterm paper of a high achiever with unique informant number of 001. The last three digits (053) refer to the unique file number.
创建时间:
2024-01-23
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

网易云音乐数据集

该数据集包含了网易云音乐平台上的歌手信息、歌曲信息和歌单信息,数据通过爬虫技术获取并整理成CSV格式,用于音乐数据挖掘和推荐系统构建。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

Cultural Dimensions Dataset

该数据集包含了霍夫斯泰德文化维度理论(Hofstede's Cultural Dimensions Theory)的相关数据,涵盖了多个国家和地区的文化维度评分,如权力距离、个人主义与集体主义、男性化与女性化、不确定性规避、长期取向与短期取向等。这些数据有助于研究不同文化背景下的行为模式和价值观。

geerthofstede.com 收录

Drone-type dataset

Drone-type数据集是由卡塔尔的Supreme Committee for Delivery and Legacy (SC)支持的研究团队创建,旨在为无人机检测和跟踪提供一个基准。该数据集包含7000张图像,涵盖了七种不同类型的无人机,图像来自YouTube视频,具有不同尺度和视野。数据集的创建过程包括从视频中提取图像并手动进行边界框标注。该数据集主要应用于无人机检测领域,旨在解决无人机类型识别的问题,提高检测系统的准确性和效率。

arXiv 收录