five

wolf4032/token-classification-japanese-search-local-cuisine

收藏
Hugging Face2024-05-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/wolf4032/token-classification-japanese-search-local-cuisine
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: entities list: - name: name dtype: string - name: span sequence: int64 - name: type dtype: string - name: text dtype: string splits: - name: train num_bytes: 557731 num_examples: 1929 download_size: 118284 dataset_size: 557731 configs: - config_name: default data_files: - split: train path: data/train-* license: mit task_categories: - token-classification language: - ja --- 料理を検索するための質問文と、質問文に含まれる検索検索用キーワードの情報を持ったデータセットです 固有表現の種類は以下の4つです。 1. AREA: 都道府県/地方 1. TYPE: 種類 1. SZN: 季節 1. INGR: 食材 GitHub - [untokenized_dataset_list.ipynb](https://github.com/wolf4032/nlp-token-classification/blob/main/local_cuisine_search_app/notebooks/create_data/04_encoded_dataset_dataframe/encoded_dataset_dataframe_dependencies/01_untokenized_dataset_list/untokenized_dataset_list.ipynb)(データセットの作成に使ったノートブック) - このデータセットを使った言語モデルのファインチューニングと、ファインチューニングした言語モデルを使ったアプリのコードもこのリポジトリにあります 詳細情報 - [Qiita](https://qiita.com/wolf4032/private/9dd7423c706fa86bf005)
提供机构:
wolf4032
原始信息汇总

数据集概述

数据集信息

  • 特征:
    • entities:
      • name: 类型为 string
      • span: 类型为 int64 的序列
      • type: 类型为 string
    • text: 类型为 string
  • 分割:
    • train:
      • 字节数: 557731
      • 样本数: 1929
  • 下载大小: 118284 字节
  • 数据集大小: 557731 字节
  • 配置:
    • default:
      • 数据文件:
        • train: 路径为 data/train-*
  • 许可证: MIT
  • 任务类别:
    • token-classification
  • 语言:
    • ja

固有表現类型

  1. AREA: 都道府県/地方
  2. TYPE: 種類
  3. SZN: 季節
  4. INGR: 食材
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作