bene-ges/spellmapper_en_train_v1
收藏Hugging Face2023-12-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bene-ges/spellmapper_en_train_v1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于训练SpellMapper模型第一个版本的训练数据集,包含33547074个训练示例。实际训练时只使用了数据集的1/3。
该数据集是用于训练SpellMapper模型第一个版本的训练数据集,包含33547074个训练示例。实际训练时只使用了数据集的1/3。
提供机构:
bene-ges
原始信息汇总
数据集概述
基本信息
- 许可证: cc-by-4.0
- 语言: 英语
- 任务类别: 令牌分类
- 大小类别: 10M<n<100M
数据集详情
- 用途: 用于训练SpellMapper模型的第一个版本
- 包含样本数: 33,547,074个训练样本
- 实际使用情况: 仅使用了完整数据集的1/3进行模型训练
相关文献
- 论文标题: SpellMapper: A non-autoregressive neural spellchecker for ASR customization with candidate retrieval based on n-gram mappings
- 发表年份: 2023
- 作者: Antonova, Alexandra; Bakhturina, Evelina; Ginsburg, Boris
- DOI: 10.21437/Interspeech.2023-768



