five

unitxt/data

收藏
Hugging Face2025-08-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/unitxt/data
下载链接
链接失效反馈
官方服务:
资源简介:
Unitxt是一个创新的库,专注于为生成式语言模型提供可定制的文本数据准备和评估工具。它通过模块化组件的方式,支持用户自定义和共享数据处理流程,并与HuggingFace等常见库无缝集成。Unitxt-Catalog集中了这些组件,促进了现代文本数据工作流的协作和探索。此外,Unitxt是一个社区驱动的平台,鼓励用户共同构建、分享和推进他们的数据处理管道。

Unitxt is an innovative library for customizable textual data preparation and evaluation tailored to generative language models. It deconstructs processing flows into modular components, enabling easy customization and sharing between practitioners, and natively integrates with common libraries like HuggingFace. The Unitxt-Catalog centralizes these components, fostering collaboration and exploration in modern textual data workflows. Beyond being a tool, Unitxt is a community-driven platform, empowering users to build, share, and advance their pipelines collaboratively.
提供机构:
unitxt
原始信息汇总

数据集概述

许可证信息

  • 许可证类型: Apache-2.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作