tolulope/ml-superb-subset
收藏Hugging Face2024-05-18 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/tolulope/ml-superb-subset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是ML-SUPERB数据集的一个子集,专为斯坦福大学的CS 224S课程设计。它包含了ML-SUPERB数据集中mexico-el、nchlt和ALFA部分的数据。文件夹名称采用ISO 639-3标准,代表每种语言的代码。
该数据集是ML-SUPERB数据集的一个子集,专为斯坦福大学的CS 224S课程设计。它包含了ML-SUPERB数据集中mexico-el、nchlt和ALFA部分的数据。文件夹名称采用ISO 639-3标准,代表每种语言的代码。
提供机构:
tolulope
原始信息汇总
数据集概述
数据集名称
- 名称:Subset of ML-SUPERB for 224S Homework 3
数据集来源
- 来源:ML-SUPERB 数据集的子集,专门为斯坦福大学的 CS 224S: Spoken Language Processing 课程设计。
数据集内容
- 包含部分:数据集包含来自 ML-SUPERB 数据集的 mexico-el, nchlt 和 ALFA 部分。
- 语言标识:数据集中的文件夹使用 ISO 639-3 代码作为每种语言的标识。
数据集加载方法
- 加载代码示例: python from datasets import load_dataset tsn_test = load_dataset("tolulope/ml-superb-subset", name="tsn", split="test[:100]")
数据集用途
- 用途:专为斯坦福大学 CS 224S 课程的作业3设计,用于口语语言处理相关的研究和教学活动。



