five

nataliaElv/data_curation

收藏
Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nataliaElv/data_curation
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是通过distilabel工具生成的,专门针对农业领域的特定数据集。数据集的种子数据由领域专家定义,生成的数据可以在Argilla平台上查看。此外,README文件还讨论了数据管理领域的不同视角和主题,并提供了一个关于如何确保数据集一致性的示例。

该数据集是通过distilabel工具生成的,专门针对农业领域的特定数据集。数据集的种子数据由领域专家定义,生成的数据可以在Argilla平台上查看。此外,README文件还讨论了数据管理领域的不同视角和主题,并提供了一个关于如何确保数据集一致性的示例。
提供机构:
nataliaElv
原始信息汇总

数据集概述

数据集名称

Domain Dataset Grower

数据集生成工具

distilabel生成

数据集领域

农业

数据集种子数据

种子数据由领域专家定义,用于生成样本。

数据集审查空间

可在Argilla空间进行审查。

数据集相关主题

数据质量

任务设计

数据清洗

数据集管理示例

如何确保数据集一致性

当项目初期需要更改标注模式时,应遵循以下步骤:

  1. 在标注任务配置中更改模式。
  2. 修改标注指南并通知团队。
  3. 审查可能受此更改影响的已标注数据。
  4. 确保新标签在测试分割中得到体现。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作