five

YANS-official/senryu-test

收藏
Hugging Face2024-09-09 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/YANS-official/senryu-test
下载链接
链接失效反馈
官方服务:
资源简介:
--- task_categories: - image-to-text - text2text-generation language: - ja --- ## 読み込み方 ```python from datasets import load_dataset dataset = load_dataset("YANS-official/senryu-test", split="test") ``` ## 概要 川柳投稿サイトの『写真川柳』と『川柳投稿まるせん』のクロールデータ、および YANS 委員が作成したデータを含みます。 以下のページからクロールし、原本のHTMLファイルと構造化処理を行った結果を格納しました。 * https://www.homemate-research.com/senryu/photo/ * https://marusenryu.com/ このデータは以下の2タスクが含まれます。 * image_to_text: 画像でお題が渡され、それに対する回答を返します。 * text_to_text: テキストでお題が渡され、それに対する回答を返します。 それぞれの量は以下の通りです。 | タスク | お題数(画像枚数) | | --- | ---: | | image_to_text | 70 | | text_to_text | 30 | リーダーボードには、本データセットの全件に対するシステム出力を提出していただきます。 最終的な人手評価には、このうち10件から抽出したデータを用います。 ## データセットの各カラム説明 | カラム名 | 型 | 例 | 概要 | | --- | --- | --- |---------------------------------------------------------------------------------| | odai_id | str | senryu-test-76 | お題のID | | type | str | image_to_text | "text_to_text", "image_to_text"のいずれかが入っている。 | | file_name | str | 185066.jpg | 対応するお題の画像ファイル。"text_to_textの場合は""dummy_*.png"という文字列が格納されている。 | | odai | str | "写真で一句。" | image_to_textの場合は"写真で一句"という文字列が格納されている。text_to_textの場合は"〇〇川柳"という形式で文字列が格納されている。 | ## ライセンス等 クロール元のサイトの管理者には許可をとっていませんので、YANS内でのみの利用としてください。
提供机构:
YANS-official
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作