five

bene-ges/spellmapper_en_train_v1

收藏
Hugging Face2023-12-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bene-ges/spellmapper_en_train_v1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是用于训练SpellMapper模型第一个版本的训练数据集,包含33547074个训练示例。实际训练时只使用了数据集的1/3。

该数据集是用于训练SpellMapper模型第一个版本的训练数据集,包含33547074个训练示例。实际训练时只使用了数据集的1/3。
提供机构:
bene-ges
原始信息汇总

数据集概述

基本信息

  • 许可证: cc-by-4.0
  • 语言: 英语
  • 任务类别: 令牌分类
  • 大小类别: 10M<n<100M

数据集详情

  • 用途: 用于训练SpellMapper模型的第一个版本
  • 包含样本数: 33,547,074个训练样本
  • 实际使用情况: 仅使用了完整数据集的1/3进行模型训练

相关文献

  • 论文标题: SpellMapper: A non-autoregressive neural spellchecker for ASR customization with candidate retrieval based on n-gram mappings
  • 发表年份: 2023
  • 作者: Antonova, Alexandra; Bakhturina, Evelina; Ginsburg, Boris
  • DOI: 10.21437/Interspeech.2023-768
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作