five

ZoneTwelve/tmmluplus

收藏
Hugging Face2024-01-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ZoneTwelve/tmmluplus
下载链接
链接失效反馈
官方服务:
资源简介:
TMMLU+是一个大规模的繁体中文多任务语言理解数据集,包含66个主题,涵盖从基础到专业水平的多个领域。数据集是之前TMMLU数据集的六倍大,并且包含了更平衡的主题。数据集的格式为选择题,每个任务都有训练集、验证集和测试集。基准测试结果显示,繁体中文模型在表现上仍然落后于主要基于简体中文训练的模型。

TMMLU+是一个大规模的繁体中文多任务语言理解数据集,包含66个主题,涵盖从基础到专业水平的多个领域。数据集是之前TMMLU数据集的六倍大,并且包含了更平衡的主题。数据集的格式为选择题,每个任务都有训练集、验证集和测试集。基准测试结果显示,繁体中文模型在表现上仍然落后于主要基于简体中文训练的模型。
提供机构:
ZoneTwelve
原始信息汇总

TMMLU+ 数据集概述

数据集基本信息

  • 许可证: Creative Commons BY-NC
  • 任务类别: 问答
  • 语言: 中文
  • 标签: 繁体中文、金融、医学、台湾、基准测试、zh-tw、zh-hant
  • 名称: tmmlu++
  • 大小类别: 100K<n<1M

数据集配置

TMMLU+ 数据集包含多个子任务,每个子任务都有训练、验证和测试集。以下是部分子任务及其对应的数据文件路径:

  • engineering_math

    • 训练集: data/engineering_math_dev.csv
    • 验证集: data/engineering_math_val.csv
    • 测试集: data/engineering_math_test.csv
  • dentistry

    • 训练集: data/dentistry_dev.csv
    • 验证集: data/dentistry_val.csv
    • 测试集: data/dentistry_test.csv
  • traditional_chinese_medicine_clinical_medicine

    • 训练集: data/traditional_chinese_medicine_clinical_medicine_dev.csv
    • 验证集: data/traditional_chinese_medicine_clinical_medicine_val.csv
    • 测试集: data/traditional_chinese_medicine_clinical_medicine_test.csv
  • clinical_psychology

    • 训练集: data/clinical_psychology_dev.csv
    • 验证集: data/clinical_psychology_val.csv
    • 测试集: data/clinical_psychology_test.csv
  • technical

    • 训练集: data/technical_dev.csv
    • 验证集: data/technical_val.csv
    • 测试集: data/technical_test.csv
  • culinary_skills

    • 训练集: data/culinary_skills_dev.csv
    • 验证集: data/culinary_skills_val.csv
    • 测试集: data/culinary_skills_test.csv
  • mechanical

    • 训练集: data/mechanical_dev.csv
    • 验证集: data/mechanical_val.csv
    • 测试集: data/mechanical_test.csv
  • logic_reasoning

    • 训练集: data/logic_reasoning_dev.csv
    • 验证集: data/logic_reasoning_val.csv
    • 测试集: data/logic_reasoning_test.csv
  • real_estate

    • 训练集: data/real_estate_dev.csv
    • 验证集: data/real_estate_val.csv
    • 测试集: data/real_estate_test.csv
  • general_principles_of_law

    • 训练集: data/general_principles_of_law_dev.csv
    • 验证集: data/general_principles_of_law_val.csv
    • 测试集: data/general_principles_of_law_test.csv
  • finance_banking

    • 训练集: data/finance_banking_dev.csv
    • 验证集: data/finance_banking_val.csv
    • 测试集: data/finance_banking_test.csv
  • anti_money_laundering

    • 训练集: data/anti_money_laundering_dev.csv
    • 验证集: data/anti_money_laundering_val.csv
    • 测试集: data/anti_money_laundering_test.csv
  • ttqav2

    • 训练集: data/ttqav2_dev.csv
    • 验证集: data/ttqav2_val.csv
    • 测试集: data/ttqav2_test.csv
  • marketing_management

    • 训练集: data/marketing_management_dev.csv
    • 验证集: data/marketing_management_val.csv
    • 测试集: data/marketing_management_test.csv
  • business_management

    • 训练集: data/business_management_dev.csv
    • 验证集: data/business_management_val.csv
    • 测试集: data/business_management_test.csv
  • organic_chemistry

    • 训练集: data/organic_chemistry_dev.csv
    • 验证集: data/organic_chemistry_val.csv
    • 测试集: data/organic_chemistry_test.csv
  • advance_chemistry

    • 训练集: data/advance_chemistry_dev.csv
    • 验证集: data/advance_chemistry_val.csv
    • 测试集: data/advance_chemistry_test.csv
  • physics

    • 训练集: data/physics_dev.csv
    • 验证集: data/physics_val.csv
    • 测试集: data/physics_test.csv
  • secondary_physics

    • 训练集: data/secondary_physics_dev.csv
    • 验证集: data/secondary_physics_val.csv
    • 测试集: data/secondary_physics_test.csv
  • human_behavior

    • 训练集: data/human_behavior_dev.csv
    • 验证集: data/human_behavior_val.csv
    • 测试集: data/human_behavior_test.csv
  • national_protection

    • 训练集: data/national_protection_dev.csv
    • 验证集: data/national_protection_val.csv
    • 测试集: data/national_protection_test.csv
  • jce_humanities

    • 训练集: data/jce_humanities_dev.csv
    • 验证集: data/jce_humanities_val.csv
    • 测试集: data/jce_humanities_test.csv
  • politic_science

    • 训练集: data/politic_science_dev.csv
    • 验证集: data/politic_science_val.csv
    • 测试集: data/politic_science_test.csv
  • agriculture

    • 训练集: data/agriculture_dev.csv
    • 验证集: data/agriculture_val.csv
    • 测试集: data/agriculture_test.csv
  • official_document_management

    • 训练集: data/official_document_management_dev.csv
    • 验证集: data/official_document_management_val.csv
    • 测试集: data/official_document_management_test.csv
  • financial_analysis

    • 训练集: data/financial_analysis_dev.csv
    • 验证集: data/financial_analysis_val.csv
    • 测试集: data/financial_analysis_test.csv
  • pharmacy

    • 训练集: data/pharmacy_dev.csv
    • 验证集: data/pharmacy_val.csv
    • 测试集: data/pharmacy_test.csv
  • educational_psychology

    • 训练集: data/educational_psychology_dev.csv
    • 验证集: data/educational_psychology_val.csv
    • 测试集: data/educational_psychology_test.csv
  • statistics_and_machine_learning

    • 训练集: data/statistics_and_machine_learning_dev.csv
    • 验证集: data/statistics_and_machine_learning_val.csv
    • 测试集: data/statistics_and_machine_learning_test.csv
  • management_accounting

    • 训练集: data/management_accounting_dev.csv
    • 验证集: data/management_accounting_val.csv
    • 测试集: data/management_accounting_test.csv
  • introduction_to_law

    • 训练集: data/introduction_to_law_dev.csv
    • 验证集: data/introduction_to_law_val.csv
    • 测试集: data/introduction_to_law_test.csv
  • computer_science

    • 训练集: data/computer_science_dev.csv
    • 验证集: data/computer_science_val.csv
    • 测试集: data/computer_science_test.csv
  • veterinary_pathology

    • 训练集: data/veterinary_pathology_dev.csv
    • 验证集: data/veterinary_pathology_val.csv
    • 测试集: data/veterinary_pathology_test.csv
  • accounting

    • 训练集: data/accounting_dev.csv
    • 验证集: data/accounting_val.csv
    • 测试集: data/accounting_test.csv
  • fire_science

    • 训练集: data/fire_science_dev.csv
    • 验证集: data/fire_science_val.csv
    • 测试集: data/fire_science_test.csv
  • optometry

    • 训练集: data/optometry_dev.csv
    • 验证集: data/optometry_val.csv
    • 测试集: data/optometry_test.csv
  • insurance_studies

    • 训练集: data/insurance_studies_dev.csv
    • 验证集: data/insurance_studies_val.csv
    • 测试集: data/insurance_studies_test.csv
  • pharmacology

    • 训练集: data/pharmacology_dev.csv
    • 验证集: data/pharmacology_val.csv
    • 测试集: data/pharmacology_test.csv
  • taxation

    • 训练集: data/taxation_dev.csv
    • 验证集: data/taxation_val.csv
    • 测试集: data/taxation_test.csv
  • trust_practice

    • 训练集: data/trust_practice_dev.csv
    • 验证集: data/trust_practice_val.csv
    • 测试集: data/trust_practice_test.csv
  • geography_of_taiwan

    • 训练集: data/geography_of_taiwan_dev.csv
    • 验证集: data/geography_of_taiwan_val.csv
    • 测试集: data/geography_of_taiwan_test.csv
  • physical_education

    • 训练集: data/physical_education_dev.csv
    • 验证集: data/physical_education_val.csv
    • 测试集: data/physical_education_test.csv
  • auditing

    • 训练集: data/auditing_dev.csv
    • 验证集: data/auditing_val.csv
    • 测试集: data/auditing_test.csv
  • administrative_law

    • 训练集: data/administrative_law_dev.csv
    • 验证集: data/administrative_law_val.csv
    • 测试集: data/administrative_law_test.csv
  • education_(profession_level)

    • 训练集: data/education_(profession_level)_dev.csv
    • 验证集: data/education_(profession_level)_val.csv
    • 测试集: data/education_(profession_level)_test.csv
  • economics

    • 训练集: data/economics_dev.csv
    • 验证集: data/economics_val.csv
    • 测试集: data/economics_test.csv
  • veterinary_pharmacology

    • 训练集: data/veterinary_pharmacology_dev.csv
    • 验证集: data/veterinary_pharmacology_val.csv
    • 测试集: data/veterinary_pharmacology_test.csv
  • nautical_science

    • 训练集: data/nautical_science_dev.csv
    • 验证集: data/nautical_science_val.csv
    • 测试集: data/nautical_science_test.csv
  • occupational_therapy_for_psychological_disorders

    • 训练集: data/occupational_therapy_for_psychological_disorders_dev.csv
    • 验证集: data/occupational_therapy_for_psychological_disorders_val.csv
    • 测试集: data/occupational_therapy_for_psychological_disorders_test.csv
  • basic_medical_science

    • 训练集: data/basic_medical_science_dev.csv
    • 验证集: data/basic_medical_science_val.csv
    • 测试集: data/basic_medical_science_test.csv
  • macroeconomics

    • 训练集: data/macroeconomics_dev.csv
    • 验证集: data/macroeconomics_val.csv
    • 测试集: data/macroeconomics_test.csv
  • trade

    • 训练集: data/trade_dev.csv
    • 验证集: data/trade_val.csv
    • 测试集: data/trade_test.csv
  • chinese_language_and_literature

    • 训练集: data/chinese_language_and_literature_dev.csv
    • 验证集: data/chinese_language_and_literature_val.csv
    • 测试集: data/chinese_language_and_literature_test.csv
  • tve_design

    • 训练集: data/tve_design_dev.csv
    • 验证集: data/tve_design_val.csv
    • 测试集: data/tve_design_test.csv
  • junior_science_exam

    • 训练集: data/junior_science_exam_dev.csv
    • 验证集: data/junior_science_exam_val.csv
    • 测试集: data/junior_science_exam_test.csv
  • junior_math_exam

    • 训练集: data/junior_math_exam_dev.csv
    • 验证集: data/junior_math_exam_val.csv
    • 测试集: data/junior_math_exam_test.csv
  • junior_chinese_exam

    • 训练集: data/junior_chinese_exam_dev.csv
    • 验证集: data/junior_chinese_exam_val.csv
    • 测试集: data/junior_chinese_exam_test.csv
  • junior_social_studies

    • 训练集: data/junior_social_studies_dev.csv
    • 验证集: data/junior_social_studies_val.csv
    • 测试集: data/junior_social_studies_test.csv
  • tve_mathematics

    • 训练集: data/tve_mathematics_dev.csv
    • 验证集: data/tve_mathematics_val.csv
    • 测试集: data/tve_mathematics_test.csv
  • tve_chinese_language

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作