five

Atsushi/fungi_diagnostic_chars_comparison_japanese

收藏
Hugging Face2024-06-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Atsushi/fungi_diagnostic_chars_comparison_japanese
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集名为fungi_diagnostic_chars_comparison_japanese,主要包含从菌类分类学论文中提取的识别特征,这些特征被分类并标记为不同的类别。数据集仅提供日语版本,且更新频率大约为每月一次。数据集由中岛淳志个人运营的网站大菌轮提供,该网站对数千件以上的菌类分类学论文进行了摘要和索引。数据集中的识别特征包括色/color、形状/shape等25个类别,每个特征都被标记为共通或异同。数据集还提供了每个特征的来源文献URL。

This dataset is named fungi_diagnostic_chars_comparison_japanese. It primarily includes diagnostic features extracted from fungal taxonomy papers, which are classified and labeled into distinct categories. Only the Japanese version of this dataset is available, with an update frequency of approximately once per month. This dataset is provided by Daikinrin, a website individually operated by Nakajima Atsushi, which has summarized and indexed thousands of fungal taxonomy papers. The diagnostic features covered in the dataset span 25 categories such as color, shape, and more. Each feature is labeled as either "common" or "differing". Furthermore, the dataset provides the source literature URL for every individual feature.
提供机构:
Atsushi
原始信息汇总

数据集概述

基本信息

  • 名称:fungi_diagnostic_chars_comparison_japanese
  • 语言:仅提供日语版本
  • 许可证:CC-BY-4.0
  • 数据来源:原始数据
  • 任务类别:文本分类
  • 任务ID:多类分类
  • 数据集大小:100K<n<1M

数据集描述

本数据集由Atsushi Nakajima(中島淳志)个人运营的网站大菌輪提供,主要包含从数千件菌类分类学论文中手动提取的识别特征(diagnostic characters)描述。数据集中的每条记录包括识别特征的描述及其相关的分类信息,如颜色、形状等,这些分类信息是通过半自动方式附加的。

数据集结构

  • R3ID:大菌輪「論文3行まとめ」的ID。
  • No:各识别文的唯一ID。
  • comparison_source:比较源的分类群(学名)。
  • comparison_target:比较目标的分类群(学名)。
  • sentence:识别文,全部为日语。
  • label:半自动附加的分类,包括25种分类,如尺寸、形状、颜色等。
  • common_or_different:共通形質为“1”,不同形質为“0”。
  • data_source:信息来源的文献URL。

更新频率

数据集计划大约每月更新一次。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作