five

Cuarzo-AI/cuarzo-100k

收藏
Hugging Face2026-04-29 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Cuarzo-AI/cuarzo-100k
下载链接
链接失效反馈
官方服务:
资源简介:
Cuarzo-100K数据集包含99,692个双向确定性配对的Python代码片段与人类语言(英语、西班牙语和法语)的表示。该数据集由Cuarzo AI的专有引擎Aether生成,确保代码与自然语言之间可验证、双向且确定性控制的对齐。数据集适用于训练和微调代码-语言模型、多语言代码生成以及评估。详细统计信息包括验证、多语言覆盖、源代码多样性和组成。

Cuarzo-100K is a dataset of 99,692 bidirectional deterministically paired Python code snippets with human language representations in English, Spanish, and French. Generated using Cuarzo AIs proprietary Aether engine, it ensures verifiable, bidirectional, and deterministically controlled alignment between code and natural language. The dataset is designed for training and fine-tuning code-language models, multilingual code generation, and evaluation. It includes detailed statistics on verification, multilingual coverage, source diversity, and composition.
提供机构:
Cuarzo-AI
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作