napsternxg/nyt_ingredients

Name: napsternxg/nyt_ingredients
Creator: napsternxg
Published: 2023-10-07 00:45:48
License: 暂无描述

Hugging Face2023-10-07 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/napsternxg/nyt_ingredients

下载链接

链接失效反馈

官方服务：

资源简介：

New York Times Ingredient Phrase Tagger Dataset是一个用于从非结构化成分短语中提取数量、单位、名称和评论的数据集。数据集由专家生成，语言为英语，创建者未明确说明，但语言是从现有资源中找到的。数据集是单语言的，遵循Apache 2.0许可证。数据集的大小在10万到100万之间，标签包括食谱和成分，任务类别为令牌分类，具体任务为命名实体识别。数据集的原始来源是纽约时报的一个GitHub仓库，该仓库使用条件随机场模型（CRF）从标记的训练数据中提取标签，这些数据由人类新闻助理标记。

提供机构：

napsternxg

原始信息汇总