five

YY1128/small_tengentoppa_12k

收藏
Hugging Face2024-12-15 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/YY1128/small_tengentoppa_12k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是从一个更大的日语学习数据集[DeL-TaiseiOzaki/Tengentoppa-sft-v1.0]中提取的一部分,用于指令调优的一问一答数据。数据集通过LLM[Qwen/Qwen2.5-32B-Instruct-AWQ]对数据进行了有用性标注,以便在创建学习子集时作为参考。数据集格式为Parquet,包含125497行和2列,其中prefered列表示被判断为更有用的数据,unprefered列表示被判断为无用的数据。

small tengentoppa 12k is a Japanese language learning dataset for instruction tuning, based on a subset of data from DeL-TaiseiOzaki/Tengentoppa-sft-v1.0, labeled by LLM Qwen/Qwen2.5-32B-Instruct-AWQ to determine which question-answer data is more useful. The dataset is in Parquet format, containing 125497 rows and 2 columns, where the prefered column is the data judged to be more useful, and the unprefered column is the data judged to be less useful.
提供机构:
YY1128
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作