dwb2023/filtered_coyo_700m
收藏Hugging Face2024-05-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/dwb2023/filtered_coyo_700m
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含从`kakaobrain/coyo-700m`数据集中过滤出的记录,这些记录与CAR-T细胞疗法、嵌合抗原受体、T细胞、细胞疗法、基因疗法和自体疗法等特定关键词相关。数据集可用于细胞和基因疗法领域的研究和开发。
该数据集包含从`kakaobrain/coyo-700m`数据集中过滤出的记录,这些记录与CAR-T细胞疗法、嵌合抗原受体、T细胞、细胞疗法、基因疗法和自体疗法等特定关键词相关。数据集可用于细胞和基因疗法领域的研究和开发。
提供机构:
dwb2023
原始信息汇总
数据集概述
数据集名称
- 名称: Filtered COYO-700M Dataset
- 来源: kakaobrain/coyo-700m
数据集内容
- 主题: 包含与CAR-T细胞疗法、嵌合抗原受体、T细胞、细胞疗法、基因疗法和自体相关的关键词过滤记录。
数据集特征
- 特征列表:
- id: int64
- url: string
- text: string
- width: int32
- height: int32
- image_phash: string
- text_length: int32
- word_count: int32
- num_tokens_bert: int32
- num_tokens_gpt: int32
- num_faces: int32
- clip_similarity_vitb32: float32
- clip_similarity_vitl14: float32
- nsfw_score_opennsfw2: float32
- nsfw_score_gantman: float32
- watermark_score: float32
- aesthetic_score_laion_v2: float32
数据集划分
- 训练集:
- 示例数: 17856
- 字节数: 4962803.0
- 测试集:
- 示例数: 4465
- 字节数: 1237070.0
数据集大小
- 下载大小: 4356201
- 数据集大小: 6199873.0
数据集配置
- 默认配置:
- 训练数据路径: data/train-*
- 测试数据路径: data/test-*
许可证
- 许可证: MIT
用途
- 应用领域: 细胞和基因疗法的研究与开发。
引用信息
@misc{kakaobrain2022coyo-700m, title = {COYO-700M: Image-Text Pair Dataset}, author = {Minwoo Byeon, Beomhee Park, Haecheon Kim, Sungjun Lee, Woonhyuk Baek, Saehoon Kim}, year = {2022}, howpublished = {url{https://github.com/kakaobrain/coyo-dataset}}, }



