LLM提示推荐合成数据集
收藏arXiv2025-10-08 更新2025-10-10 收录
下载链接:
https://www.kaggle.com/datasets/jordanln/prompt-recommendations-for-llm
下载链接
链接失效反馈官方服务:
资源简介:
本研究提出了一个名为LLM提示推荐合成数据集,旨在为大型语言模型(LLM)生成AI模型时提供伦理提示推荐。该数据集包含3612条记录,每条记录包括一个提示、一个相关提示和一个1至5的评分,用于评估提示的伦理或语境相关性。数据集由ChatGPT 4o创建,并通过协作过滤算法进行推荐,以帮助用户选择相关的提示,提高效率并确保提示的推荐基于类似用户的交互历史。
This study proposes a synthetic dataset named the LLM Prompt Recommendation Dataset, which aims to provide ethical prompt recommendations for scenarios where large language models (LLMs) are used to generate AI models. The dataset contains 3,612 records, with each record including a prompt, a related prompt, and a score ranging from 1 to 5 for evaluating the ethical or contextual relevance of the prompt. Developed by ChatGPT-4o, the dataset leverages collaborative filtering algorithms for recommendation purposes, to help users select relevant prompts, improve efficiency, and ensure that prompt recommendations are grounded in the interaction histories of similar users.
提供机构:
英国布莱顿大学建筑技术与工程学院, 塞浦路斯尼科西亚Catalink有限公司
创建时间:
2025-10-08
搜集汇总
数据集介绍

构建方式
在人工智能伦理研究领域,该数据集通过合成方法构建,模拟用户对提示词之间的关联性评估。研究团队借鉴了推荐系统中经典的MovieLens数据集结构,将用户-电影-评分的三元组转化为提示词-提示词-评分的创新范式。利用ChatGPT 4o生成3612条数据记录,每条记录包含两个提示词及其在1-5分尺度上的语义关联强度评分,这种构建方式为研究提示词间的伦理关联性提供了标准化实验环境。
特点
该数据集最显著的特征在于其专门针对大型语言模型伦理提示设计的定向性。数据条目呈现高度结构化特质,每个提示词对都经过精心设计以体现不同的伦理维度,如公平性、隐私保护和偏见消除等。评分机制不仅反映语义相似度,更蕴含伦理价值取向的量化评估,为研究伦理提示推荐提供了多层次的分析视角。数据集虽为合成生成,但其内容设计紧密贴合实际应用场景,覆盖医疗、教育、金融等多个高风险领域。
使用方法
在使用该数据集时,研究者可采用协同过滤算法挖掘提示词间的潜在关联模式。通过计算提示词对的皮尔逊相关系数,系统能够识别具有相似伦理特征的提示词集群。实际应用时,用户输入基础提示词后,系统会从数据集中检索评分最高的关联提示词作为推荐结果。这种基于集体用户行为模式的学习方法,使推荐系统能够动态适应不断演进的伦理标准,同时通过语义相似度计算确保对新提示词的泛化能力。
背景与挑战
背景概述
在人工智能技术迅猛发展的背景下,大型语言模型(LLMs)已成为推动机器学习创新的核心工具。然而,这些模型在生成代码和解决方案时,常面临公平性、偏见和伦理合规性等挑战。为应对这些问题,由布莱顿大学与Catalink有限公司的研究团队于2024年联合创建的LLM提示推荐合成数据集,旨在通过协同过滤技术优化伦理提示的选择。该数据集包含3612条合成提示对及其评分,模拟用户交互模式,为核心研究问题——如何在LLM辅助的代码生成中动态推荐符合伦理准则的提示——提供了数据基础,对高风险的医疗、金融等领域AI系统的负责任开发具有重要影响力。
当前挑战
该数据集致力于解决LLM提示推荐领域的核心挑战,即如何在动态环境中确保推荐内容符合伦理标准,同时避免强化历史数据中的偏见。构建过程中的挑战包括合成数据难以完全模拟真实用户输入的多样性和复杂性,例如用户提示可能存在语义模糊或领域特定表达,导致推荐系统在精确匹配时失效。此外,数据集依赖于模拟评分,可能无法覆盖实际应用中的 nuanced 伦理权衡,需通过语义相似性计算和动态扩展机制来弥补这一局限。
常用场景
经典使用场景
在人工智能伦理与大型语言模型交互领域,该数据集通过模拟用户对提示的评分交互,构建了基于协同过滤的推荐框架。其经典应用场景聚焦于为LLM用户提供符合伦理准则的提示建议,例如在生成机器学习代码时,系统能够根据历史交互数据推荐具有公平性、隐私保护或偏见缓解特性的提示,从而引导模型输出更负责任的结果。
衍生相关工作
该数据集启发了多项延伸研究,包括结合语义相似度计算与BERT嵌入向量的混合推荐模型,以及针对动态场景的实时伦理提示更新机制。相关经典工作进一步探索了可解释人工智能技术与对抗性攻击防御策略的集成,通过引入用户反馈循环与多模态伦理约束,持续优化推荐系统的鲁棒性与适应性。
数据集最近研究
最新研究方向
在人工智能伦理治理领域,LLM提示推荐合成数据集正推动基于协同过滤的伦理对齐机制研究。该数据集通过模拟用户对提示词的交互评分,构建了包含3612条合成数据的评估基准,为缓解大语言模型在代码生成过程中的偏见传播与伦理风险提供了量化工具。当前研究聚焦于动态阈值优化与语义相似度计算的融合,通过调整评分阈值(如3.0与3.5)平衡推荐系统的精确度与召回率,同时利用BERT等嵌入模型解决陌生提示词的语义匹配难题。这一方向不仅强化了推荐系统在医疗、金融等高风险领域的适应性,更通过可扩展数据集架构为伦理约束的持续演化提供了技术支撑。
相关研究论文
- 1Ethical AI prompt recommendations in large language models using collaborative filtering英国布莱顿大学建筑技术与工程学院, 塞浦路斯尼科西亚Catalink有限公司 · 2025年
以上内容由遇见数据集搜集并总结生成



