業務自動化で脱・手作業!一人事務のDX活用術 | RPA・自動化ツール

業務自動化で脱・手作業!一人事務のDX活用ブログ|RPA・自動化ツールで業務をもっとラクに、もっとスマートに

ChatGPT×GASでプリント要約を自動化しようとしたけど、PlusのOCRが神すぎた話

ChatGPT×GASでプリント要約を自動化しようとしたけど、PlusのOCRが神すぎた話

お子さんのいるご家庭では、毎日のプリント整理に頭を抱えていませんか?

特に新年度が始まる春先は、書類、提出物、持ち物チェックで毎日てんやわんや。

かくいう私も、まさにその渦中にいるひとりです。

そんな中ふと思いました。

「これ、誰か要約してくれないかな……提出期限と持ち物だけでいいんだけどな……」

そう思った私は、ChatGPTとGAS(Google Apps Script)を組み合わせて、 プリント要約システムを自作することにしました。


やりたかったこと

  1. Googleフォームからプリント画像をアップロード

  2. GASで画像をOCR(文字起こし)し、ChatGPTに投げて要約させる

  3. 要約結果をメールで通知

たったこれだけの流れです。ですが……これが意外と大変でした。


OCRの壁とChatGPTの違い

まず、ChatGPTのAPIにはOCR機能がありません。

画像をテキストとして読み取る力はないため、Googleドライブ側にOCRしてもらい、 その結果をChatGPTに渡すという構成に。

GASでコードを書き、まずはGPT-3.5に接続して実験。 メールで要約が返ってきました。


🤖GPT-3.5の回答:

  • 9月15日までに夏休みの宿題を提出してください。

  • 9月20日に文化祭が開催されます。

  • 10月5日に保護者会を予定しています。

  • 10月10日は体育祭です。

……おお、なんかそれっぽい!✨

ということで本番として、GPT-4o(GPT-4の新バージョン)にモデルを切り替え、 プロンプトも丁寧に調整して再実行。


🤖GPT-4oの回答:

申し訳ありませんが、原文の提供がありませんので要約できません。

ん????

ログを確認すると、Google OCRがまったく文字を認識していない。 でも同じ画像でGPT-3.5はそれっぽい要約を返していたのです。

あれ?🤔

よくよく見返すと、先ほどの内容――夏休みの宿題、文化祭、保護者会、体育祭…… どれも、実はプリントに書いてない!!!!

つまりGPT-3.5は「何も読めなかったけど、保護者向けプリントってこんな感じだよね?😇」と、 過去のデータからそれっぽい情報を創作していたのです。怖っ💦

一方でGPT-4oは、テキストが空だと判断したら「できません」と正直に返してくれました。 この差、めちゃくちゃ大きいです。


実用化の壁

一応、「OCRが成功した時だけ要約を送信する」ようにコードを調整。

最低限の動作はしました。

でも……。

Googleドライブにアップロードされた写真のプリントはほぼOCR失敗。

「これ、実用的にどうなの……」と悩んだ末、ChatGPT本体に質問してみました。

👤ChatGPT Web版は、画像からテキストを読み取って要約できますか?

🤖できます!要約もできますし、持ち物や期日だけ抜き出すことも可能です!

ええええええ!!!!


Vision搭載のWebChatGPTが優秀すぎた

試しに同じプリント画像をChatGPT Web版(GPT-4o)にアップロードしてみたところ、

  • 書かれている内容を、期日・持ち物・注意事項まで完璧に抽出

  • 「どこに何が書いてあったか」まで正確に説明

もう、これでよくない????

モバイルからアップロードできるし、即時要約できるし、しかも精度抜群。


結論:Web版の有料ChatGPT(Plus)が最強だった

ChatGPT Plus(月額$20:約3,000円)プランに入ることで、 GPT-4oという超高性能モデルと、Vision機能(画像読み取り)が使えます。

正直、プリント要約だけのために月3,000円は高く感じるかもしれません。 しかし、

  • OCR精度がめちゃくちゃ高い

  • 要約が人間以上に丁寧

  • 持ち物や期日を「でっかく明記してほしい」という保護者の願いを叶えてくれる

  • しかもレシピや相談事にも乗ってくれる

……と思えば、仕事でも使えることも加味すると、ワーキングマザー・保護者にとっては十分元が取れる存在かもしれません。

▼ChatGPT PLUSでできることはこちら

keiridx.net

▼プリント要約したいけどプロンプトをいちいち切り替えるのが面倒な方はプロンプトスイッチャーがおすすめ

keiridx.net


最後に

ChatGPT×GASの組み合わせで自動化する経験は、それだけで価値がありました。 コードを書くのは大変でしたが、仕組みを知ることでAIとの付き合い方も変わります。

でも、「実用性」という観点では、やっぱりVisionを搭載したWeb版ChatGPTに、 画像を直接渡すのが一番シンプルで正確でした。

もうね、こう思います。

「プリント?とりあえずChatGPTに投げとこ」

この一言で、保護者のストレスが大幅に減る未来……すぐそこにあります。

▼ChatGPT活用なら書籍もおすすめ!

はじめての生成AI ChatGPT「超」活用術

新品価格
¥1,940から
(2025/4/21 15:18時点)

▼ 役に立ったらブックマークお願いします!

ChatGPT×GASでプリント要約を自動化しようとしたけど、PlusのOCRが神すぎた話

ChatGPT×GASでプリント要約を自動化しようとしたけど、PlusのOCRが神すぎた話
人気ブログランキング