mano-wii/blender_duplicates
收藏Hugging Face2023-11-30 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mano-wii/blender_duplicates
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含了Blender软件中报告的简化问题描述,并指向了重复的问题,以便进行相似性分类。数据集用于训练模型,以生成3D软件技术报告的嵌入表示。数据集的创建目的是为了训练一个模型,用于搜索Blender报告中语义相似性,以支持WEB扩展Blender Find Related Issues的工作。
该数据集包含了Blender软件中报告的简化问题描述,并指向了重复的问题,以便进行相似性分类。数据集用于训练模型,以生成3D软件技术报告的嵌入表示。数据集的创建目的是为了训练一个模型,用于搜索Blender报告中语义相似性,以支持WEB扩展Blender Find Related Issues的工作。
提供机构:
mano-wii
原始信息汇总
数据集卡片
数据集详情
数据集描述
该数据集包含从 https://projects.blender.org/blender/blender/issues 报告的问题中提取的简化描述,并指向重复问题以进行相似性分类。每个报告已通过移除如系统信息、Blender版本、错误简短描述等常见重复文本进行缩短。
- 语言(NLP): 英语
- 许可证: https://mano-wii-tools.hf.space/api/v1/static/privace.txt
数据集结构
数据集中的主要问题在第一列,未识别的问题在第二列(neg),重复问题在第三列(pos)。
数据集创建
创建理由
该数据集旨在训练一个模型,用于创建嵌入以搜索Blender报告的语义相似性,从而使Blender Find Related Issues WEB扩展能够工作。
源数据
源数据来自 https://projects.blender.org/blender/blender/issues。
数据收集和处理
数据在Python中自动收集,当获取被分类为重复的报告时。这些报告随后通过其他AI模型的相似性测试进行过滤。
源数据生产者
这些报告由全球的Blender用户生成,他们有兴趣报告错误以提高软件质量。
偏差、风险和限制
用户应了解数据集的风险、偏差和技术限制。更多信息需要进一步推荐。



