Mercury7353/PyInstruct
收藏Hugging Face2024-07-03 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/Mercury7353/PyInstruct
下载链接
链接失效反馈官方服务:
资源简介:
PyBench是一个用于评估LLM代理在真实世界编码任务上表现的数据集。该数据集主要面向文本生成任务,使用英语,并包含与LLM代理、LLM、指令微调和代码相关的标签。数据集的规模在1K到10K之间。
PyBench is a dataset designed to evaluate the performance of LLM agents on real-world coding tasks. The dataset is primarily focused on text-generation tasks, uses the English language, and includes tags related to LLM agents, LLMs, instruction-tuning, and code. The size of the dataset is between 1K and 10K.
提供机构:
Mercury7353
原始信息汇总
PyBench 数据集概述
基本信息
- 许可证: Apache 2.0
- 任务类别: 文本生成
- 语言: 英语
- 标签:
- llm-agent
- llm
- instruction-tuning
- code
- 数据集大小: 1K<n<10K
描述
PyBench 数据集用于评估大型语言模型(LLM)代理在各种真实世界编码任务中的表现。



