five

InsultedByMathematics/llama3-ultrafeedback-armo-test-evaluation-update-201

收藏
Hugging Face2024-11-23 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/InsultedByMathematics/llama3-ultrafeedback-armo-test-evaluation-update-201
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个特征,主要涉及微调后的响应、提示、奖励值、选择的响应、拒绝的响应等。数据集的特征包括字符串类型的微调响应、提示、选择的响应和拒绝的响应,以及浮点数类型的奖励值和序列类型的提示标记。数据集的分割为test_prefs,包含1690个示例,总大小为105053218字节。

This dataset contains multiple features, mainly involving fine-tuned responses, prompts, reward values, chosen responses, and rejected responses. The features of the dataset include string-type fine-tuned responses, prompts, chosen responses, and rejected responses, as well as float-type reward values and sequence-type prompt tokens. The dataset is split into test_prefs, containing 1690 examples with a total size of 105053218 bytes.
提供机构:
InsultedByMathematics
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作