nataliaElv/data_curation
收藏Hugging Face2024-04-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/nataliaElv/data_curation
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是通过distilabel工具生成的,专门针对农业领域的特定数据集。数据集的种子数据由领域专家定义,生成的数据可以在Argilla平台上查看。此外,README文件还讨论了数据管理领域的不同视角和主题,并提供了一个关于如何确保数据集一致性的示例。
该数据集是通过distilabel工具生成的,专门针对农业领域的特定数据集。数据集的种子数据由领域专家定义,生成的数据可以在Argilla平台上查看。此外,README文件还讨论了数据管理领域的不同视角和主题,并提供了一个关于如何确保数据集一致性的示例。
提供机构:
nataliaElv
原始信息汇总
数据集概述
数据集名称
Domain Dataset Grower
数据集生成工具
由distilabel生成
数据集领域
农业
数据集种子数据
种子数据由领域专家定义,用于生成样本。
数据集审查空间
可在Argilla空间进行审查。
数据集相关主题
数据质量
任务设计
数据清洗
数据集管理示例
如何确保数据集一致性
当项目初期需要更改标注模式时,应遵循以下步骤:
- 在标注任务配置中更改模式。
- 修改标注指南并通知团队。
- 审查可能受此更改影响的已标注数据。
- 确保新标签在测试分割中得到体现。



