five

tner/mit_restaurant

收藏
Hugging Face2022-08-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tner/mit_restaurant
下载链接
链接失效反馈
官方服务:
资源简介:
MIT Restaurant数据集是一个用于命名实体识别(NER)任务的数据集,专注于餐厅领域。该数据集包含8种实体类型:评分(Rating)、设施(Amenity)、位置(Location)、餐厅名称(Restaurant_Name)、价格(Price)、营业时间(Hours)、菜品(Dish)和菜系(Cuisine)。数据集的结构包括数据实例、标签ID和数据分割。数据实例展示了训练集的一个示例,标签ID部分提供了实体类型与ID的映射关系,数据分割部分列出了训练集、验证集和测试集的数量。

The MIT Restaurant dataset is a specialized dataset designed for the Named Entity Recognition (NER) task, focusing on the restaurant domain. It contains 8 entity types: Rating, Amenity, Location, Restaurant_Name, Price, Hours, Dish, and Cuisine. The structure of the dataset includes three components: data instances, label IDs, and data splits. Specifically, the data instances showcase an example from the training set, the label ID section provides the mapping between entity types and their corresponding IDs, and the data splits section lists the sample counts of the training, validation, and test sets.
提供机构:
tner
原始信息汇总

数据集概述

基本信息

  • 数据集名称: MIT Restaurant
  • 领域: 餐饮
  • 实体数量: 8

数据集详情

  • 实体类型: Rating, Amenity, Location, Restaurant_Name, Price, Hours, Dish, Cuisine

数据结构

数据实例

  • 示例: json { tags: [0, 0, 0, 0, 0, 0, 0, 0, 5, 3, 4, 0], tokens: [can, you, find, the, phone, number, for, the, closest, family, style, restaurant] }

标签ID

  • 标签映射: 详见此处

数据分割

名称 训练集 验证集 测试集
mit_restaurant 6900 760 1521
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
MIT Restaurant NER数据集是一个专门用于餐厅领域命名实体识别的英文数据集,包含8种实体类型,总共有9,181条数据,分为训练集(6,900条)、验证集(760条)和测试集(1,521条)。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作