five

Duolingo SLAM Shared Task

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Duolingo_SLAM_Shared_Task
下载链接
链接失效反馈
官方服务:
资源简介:
该存储库包含 gzip 压缩文件,其中包含 6,000 多名学生在使用 Duolingo 的前 30 天内提交的答案中的超过 200 万个标记(单词)。它还包含用 Python 编写的基线起始代码。共有三个数据集,对应三个不同的语言课程。有关数据集和任务的更多详细信息,请访问:http://sharedtask.duolingo.com。 (2018-01-10)

This repository contains gzip-compressed files that hold over 2 million tokens (words) sourced from answers submitted by more than 6,000 students during their first 30 days of using Duolingo. It also includes baseline starter code written in Python. There are three datasets in total, corresponding to three distinct language courses. For more details regarding the dataset and the associated task, please visit: http://sharedtask.duolingo.com. (2018-01-10)
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Duolingo SLAM Shared Task数据集包含6,000多名语言学习者的200多万个单词标记,覆盖三种语言课程,用于第二语言习得建模研究。数据集以gzip压缩格式提供,发布于2018年,采用CC BY-NC 4.0许可协议。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作