five

BramVanroy/xlwic_wn

收藏
Hugging Face2023-10-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/BramVanroy/xlwic_wn
下载链接
链接失效反馈
官方服务:
资源简介:
多语言上下文词汇(WordNet)数据集支持多种语言,包括保加利亚语、中文、克罗地亚语、丹麦语、荷兰语、爱沙尼亚语、波斯语、日语和韩语。该数据集的任务类别为文本分类,每个语言配置包含验证集和测试集。
提供机构:
BramVanroy
原始信息汇总

Multilingual Word-in-Context (WordNet)

许可证

  • CC BY-NC 4.0

支持的语言

  • 保加利亚语 (bg)
  • 中文 (zh)
  • 克罗地亚语 (hr)
  • 丹麦语 (da)
  • 荷兰语 (nl)
  • 爱沙尼亚语 (et)
  • 波斯语 (fa)
  • 日语 (ja)
  • 韩语 (ko)

任务类别

  • 文本分类

配置详情

默认配置

  • 分隔符:
  • 数据文件:
    • 验证集: **/*_valid.csv
    • 测试集: **/*_test.csv

保加利亚语配置

  • 分隔符:
  • 数据文件:
    • 验证集: bulgarian_bg/bg_valid.csv
    • 测试集: bulgarian_bg/bg_test.csv

中文配置

  • 分隔符:
  • 数据文件:
    • 验证集: chinese_zh/zh_valid.csv
    • 测试集: chinese_zh/zh_test.csv

克罗地亚语配置

  • 分隔符:
  • 数据文件:
    • 验证集: croatian_hr/hr_valid.csv
    • 测试集: croatian_hr/hr_test.csv

丹麦语配置

  • 分隔符:
  • 数据文件:
    • 验证集: danish_da/da_valid.csv
    • 测试集: danish_da/da_test.csv

荷兰语配置

  • 分隔符:
  • 数据文件:
    • 验证集: dutch_nl/nl_valid.csv
    • 测试集: dutch_nl/nl_test.csv

爱沙尼亚语配置

  • 分隔符:
  • 数据文件:
    • 验证集: estonian_et/et_valid.csv
    • 测试集: estonian_et/et_test.csv

波斯语配置

  • 分隔符:
  • 数据文件:
    • 验证集: farsi_fa/fa_valid.csv
    • 测试集: farsi_fa/fa_test.csv

日语配置

  • 分隔符:
  • 数据文件:
    • 验证集: japanese_ja/ja_valid.csv
    • 测试集: japanese_ja/ja_test.csv

韩语配置

  • 分隔符:
  • 数据文件:
    • 验证集: korean_ko/ko_valid.csv
    • 测试集: korean_ko/ko_test.csv
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作