five

PromptSet

收藏
arXiv2024-02-27 更新2024-06-21 收录
下载链接:
https://github.com/pisterlabs/promptset
下载链接
链接失效反馈
官方服务:
资源简介:
PromptSet是由威斯康星大学麦迪逊分校创建的一个专为程序员设计的数据集,包含超过61,000个独特的开发者提示,这些提示用于开源Python程序中。数据集通过从GitHub上抓取符合特定标准的Python代码文件创建,主要关注使用如OpenAI、Anthropic等流行语言模型库的项目。PromptSet旨在通过提供大量实际使用的提示,帮助研究者和开发者理解和优化大型语言模型在实际应用中的表现,特别是在提示管理和静态分析方面。

PromptSet is a dataset developed by the University of Wisconsin-Madison specifically for programmers. It contains over 61,000 unique developer prompts designed for use in open-source Python projects. The dataset is built by scraping Python code files that meet predefined criteria from GitHub, with a primary focus on projects leveraging popular large language model (LLM) libraries such as OpenAI and Anthropic. PromptSet aims to help researchers and developers understand and optimize the performance of large language models (LLMs) in real-world applications, especially in the domains of prompt management and static analysis, by providing a large corpus of real-world, actively used prompts.
提供机构:
威斯康星大学麦迪逊分校
创建时间:
2024-02-27
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作