ManyTypes4TypeScript
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ManyTypes4TypeScript
下载链接
链接失效反馈官方服务:
资源简介:
ManyTypes4TypeScript,一个非常大的语料库,用于训练和评估 TypeScript 中基于序列的类型推断的机器学习模型。该数据集包括超过 900 万个类型注释,涉及 13,953 个项目和 539,571 个文件。该数据集大约是 Python 的类似类型推断数据集的 10 倍,并且是 TypeScript 可用的最大数据集。我们还提供对数据集的 API 访问,可以将其集成到任何标记器中,并与任何最先进的基于序列的模型一起使用。最后,我们为最先进的代码特定模型提供分析和性能结果,用于基线
提供机构:
OpenDataLab
创建时间:
2022-08-16
搜集汇总
数据集介绍

背景与挑战
背景概述
ManyTypes4TypeScript是一个用于训练和评估TypeScript中基于序列的类型推断模型的大规模语料库,包含超过900万个类型注释,覆盖约1.4万个项目和54万个文件,是TypeScript领域最大的数据集。该数据集还提供API访问,便于集成到标记器和先进模型中,并附带了基线性能分析结果。
以上内容由遇见数据集搜集并总结生成



