five

mano-wii/blender_duplicates

收藏
Hugging Face2023-11-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mano-wii/blender_duplicates
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了Blender软件中报告的简化问题描述,并指向了重复的问题,以便进行相似性分类。数据集用于训练模型,以生成3D软件技术报告的嵌入表示。数据集的创建目的是为了训练一个模型,用于搜索Blender报告中语义相似性,以支持WEB扩展Blender Find Related Issues的工作。

该数据集包含了Blender软件中报告的简化问题描述,并指向了重复的问题,以便进行相似性分类。数据集用于训练模型,以生成3D软件技术报告的嵌入表示。数据集的创建目的是为了训练一个模型,用于搜索Blender报告中语义相似性,以支持WEB扩展Blender Find Related Issues的工作。
提供机构:
mano-wii
原始信息汇总

数据集卡片

数据集详情

数据集描述

该数据集包含从 https://projects.blender.org/blender/blender/issues 报告的问题中提取的简化描述,并指向重复问题以进行相似性分类。每个报告已通过移除如系统信息Blender版本错误简短描述等常见重复文本进行缩短。

  • 语言(NLP): 英语
  • 许可证: https://mano-wii-tools.hf.space/api/v1/static/privace.txt

数据集结构

数据集中的主要问题在第一列,未识别的问题在第二列(neg),重复问题在第三列(pos)。

数据集创建

创建理由

该数据集旨在训练一个模型,用于创建嵌入以搜索Blender报告的语义相似性,从而使Blender Find Related Issues WEB扩展能够工作。

源数据

源数据来自 https://projects.blender.org/blender/blender/issues。

数据收集和处理

数据在Python中自动收集,当获取被分类为重复的报告时。这些报告随后通过其他AI模型的相似性测试进行过滤。

源数据生产者

这些报告由全球的Blender用户生成,他们有兴趣报告错误以提高软件质量。

偏差、风险和限制

用户应了解数据集的风险、偏差和技术限制。更多信息需要进一步推荐。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作