wolf4032/token-classification-japanese-search-local-cuisine
收藏Hugging Face2024-05-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/wolf4032/token-classification-japanese-search-local-cuisine
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: entities
list:
- name: name
dtype: string
- name: span
sequence: int64
- name: type
dtype: string
- name: text
dtype: string
splits:
- name: train
num_bytes: 557731
num_examples: 1929
download_size: 118284
dataset_size: 557731
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
license: mit
task_categories:
- token-classification
language:
- ja
---
料理を検索するための質問文と、質問文に含まれる検索検索用キーワードの情報を持ったデータセットです
固有表現の種類は以下の4つです。
1. AREA: 都道府県/地方
1. TYPE: 種類
1. SZN: 季節
1. INGR: 食材
GitHub
- [untokenized_dataset_list.ipynb](https://github.com/wolf4032/nlp-token-classification/blob/main/local_cuisine_search_app/notebooks/create_data/04_encoded_dataset_dataframe/encoded_dataset_dataframe_dependencies/01_untokenized_dataset_list/untokenized_dataset_list.ipynb)(データセットの作成に使ったノートブック)
- このデータセットを使った言語モデルのファインチューニングと、ファインチューニングした言語モデルを使ったアプリのコードもこのリポジトリにあります
詳細情報
- [Qiita](https://qiita.com/wolf4032/private/9dd7423c706fa86bf005)
提供机构:
wolf4032
原始信息汇总
数据集概述
数据集信息
- 特征:
entities:name: 类型为stringspan: 类型为int64的序列type: 类型为string
text: 类型为string
- 分割:
train:- 字节数: 557731
- 样本数: 1929
- 下载大小: 118284 字节
- 数据集大小: 557731 字节
- 配置:
default:- 数据文件:
train: 路径为data/train-*
- 数据文件:
- 许可证: MIT
- 任务类别:
token-classification
- 语言:
ja
固有表現类型
- AREA: 都道府県/地方
- TYPE: 種類
- SZN: 季節
- INGR: 食材



