tner/mit_restaurant
收藏Hugging Face2022-08-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tner/mit_restaurant
下载链接
链接失效反馈官方服务:
资源简介:
MIT Restaurant数据集是一个用于命名实体识别(NER)任务的数据集,专注于餐厅领域。该数据集包含8种实体类型:评分(Rating)、设施(Amenity)、位置(Location)、餐厅名称(Restaurant_Name)、价格(Price)、营业时间(Hours)、菜品(Dish)和菜系(Cuisine)。数据集的结构包括数据实例、标签ID和数据分割。数据实例展示了训练集的一个示例,标签ID部分提供了实体类型与ID的映射关系,数据分割部分列出了训练集、验证集和测试集的数量。
The MIT Restaurant dataset is a specialized dataset designed for the Named Entity Recognition (NER) task, focusing on the restaurant domain. It contains 8 entity types: Rating, Amenity, Location, Restaurant_Name, Price, Hours, Dish, and Cuisine. The structure of the dataset includes three components: data instances, label IDs, and data splits. Specifically, the data instances showcase an example from the training set, the label ID section provides the mapping between entity types and their corresponding IDs, and the data splits section lists the sample counts of the training, validation, and test sets.
提供机构:
tner
原始信息汇总
数据集概述
基本信息
- 数据集名称: MIT Restaurant
- 领域: 餐饮
- 实体数量: 8
数据集详情
- 实体类型:
Rating,Amenity,Location,Restaurant_Name,Price,Hours,Dish,Cuisine
数据结构
数据实例
- 示例: json { tags: [0, 0, 0, 0, 0, 0, 0, 0, 5, 3, 4, 0], tokens: [can, you, find, the, phone, number, for, the, closest, family, style, restaurant] }
标签ID
- 标签映射: 详见此处
数据分割
| 名称 | 训练集 | 验证集 | 测试集 |
|---|---|---|---|
| mit_restaurant | 6900 | 760 | 1521 |
搜集汇总
数据集介绍

背景与挑战
背景概述
MIT Restaurant NER数据集是一个专门用于餐厅领域命名实体识别的英文数据集,包含8种实体类型,总共有9,181条数据,分为训练集(6,900条)、验证集(760条)和测试集(1,521条)。
以上内容由遇见数据集搜集并总结生成



