業務自動化で脱・手作業!一人事務のDX活用術 | RPA・自動化ツール

業務自動化で脱・手作業!一人事務のDX活用ブログ|RPA・自動化ツールで業務をもっとラクに、もっとスマートに

音声で返してくれるAI秘書を作ってみたけど…実用性はどうなの?しゃべるアシスピーの実験レポート

音声で返してくれるAI秘書を作ってみたけど…実用性はどうなの?しゃべるアシスピーの実験レポート

朝、パソコンを立ち上げたら「おはようございます。今日は10時から会議、午後は曇りの予報です」としゃべってくれるAI秘書。
そんな未来、ちょっと便利そうじゃないですか?

今回はそんな妄想からはじまり、「しゃべるAI秘書(アシスピー)」を自作してみました。
果たして実用になるのか?どんな技術を使ってどう実装したのか?試してみた結果と感想をまとめます。

▼以前作成した毎朝の情報収集をAIが行ってくれる秘書アシスピーはこちら

keiridx.net


思いついたきっかけ:OK Googleみたいな秘書がほしい!

このアイデアの出発点は、「OK Google」や「Alexa」のような音声アシスタントが、もっとパーソナルな情報を話してくれたら便利かも?という妄想でした。

たとえば…

  • 手が離せない朝の時間帯に

  • 今日の予定や天気、ニュースを自動でしゃべってくれたら

  • スマホやカレンダーを見る手間が省けてラク

そう思ったのがきっかけで、「じゃあ、自分で作ってみよう」と思い立ったのです。


作った仕組み:GAS×ChatGPT×音声APIで構成

構成はざっくり以下の通りです。

  • Googleカレンダー、天気API、ニュースRSSから情報を取得(GAS)

  • ChatGPT APIで、朝のあいさつ&要約文を自動生成

  • OpenAIの音声API(TTS)で、mp3音声に変換

  • GASでmp3ファイルをGoogleドライブに保存 → HTMLから再生

たとえば「明日の予定教えて」とフォームから送信すると、
カレンダーの予定をChatGPTが自然な口調に整形し、音声で返してくれるという流れです。

音声入力は技術的にまだ厳しかったため、送信はテキスト、返信は音声というスタイルで対応しました。

▼テキストボックスに入力して送信

音声で返してくれるAI秘書を作ってみたけど…実用性はどうなの?しゃべるアシスピーの実験レポート


動かしてみた感想:正直、遅い&ぎこちない

実際に動かしてみると、まず感じたのがレスポンスの遅さです。

  • ChatGPTの生成に数秒

  • 音声変換に数秒

  • mp3保存&再生にさらに数秒

結果、ボタンを押してから再生まで10秒前後かかることもありました。
また、音声の日本語がカタコトで、「日本語がうまい外国人」感が出てしまうのも気になりました。

イメージしていた「ちょっと予定教えて!」「軽く雑談して!」というような会話的な使い方には、まだほど遠く、実用性としては厳しいかな、という印象でした。


改良版:ポチっと押すと延々しゃべるアシスピー!

そこで、思い切って方向転換。

「ユーザーから話しかける形式」ではなく、
「ボタンをポチするとAI秘書が勝手に朝の情報をしゃべってくれる」構成にしてみました。

実装のポイントは以下の通りです。

元のコードを少し調整し、(元のコードはこちら↓)

  • GASの sendMorningDigest()(メール送信用)を getMorningSpeech() に変更し、テキスト出力専用に

  • doGet() でフォーム(HTML)を表示し、GAS関数を実行可能に

  • ブラウザ側では SpeechSynthesis API を使って、mp3なしで即読み上げ

読み上げの流れは…

「おはようございます。今日は○○」→予定→タスク→天気→ニュース→主婦向けのひとことアドバイス

という、アシスピーによる“朝の読み上げラジオ”のような雰囲気になりました。

音声で返してくれるAI秘書を作ってみたけど…実用性はどうなの?しゃべるアシスピーの実験レポート


結果:これは“わりと良かった”…が、惜しい点も

この改良版、反応速度はかなり改善されました!
mp3ファイルを生成しないため、再生までの待ち時間が大幅に短縮されたのは大きなメリットです。

しかしながら、以下の点は引き続き課題でした。

  • ブラウザの読み上げがゆっくり実況っぽい(自然な会話感はまだ遠い)

  • モバイルでは再生されないことがある

  • 音声に感情がなく、あくまで「読み上げているだけ」感が残る


結論:AI秘書をしゃべらせる夢は、もう少し先

今回の「しゃべるアシスピー」実験は、自分としては一区切り。

ただ、試してみたからこそわかった可能性もあります。
たとえば…

  • スプレッドシートのレポートを読み上げる秘書

  • Gmailの未読メールを音声で確認できる機能

  • 高齢者や視覚に制限のある方への「読み上げ支援」用途

など、工夫しだいでまだまだ活用の余地はありそうです。

私は今回の構成では使わないかな…という感じですが、(このレベルの読み上げであれば今のところメールで十分)
こうしたAI秘書の試作を通して、「未来にちょっと近づいた」気がしました。

▼GASとChatGPTの連携でAI秘書を自作してみたい!という方は、こちらの書籍も参考になります

音声で返してくれるAI秘書を作ってみたけど…実用性はどうなの?しゃべるアシスピーの実験レポート

Google Apps Script × ChatGPTのツボとコツがゼッタイにわかる本

新品価格
¥1,960から
(2025/4/5 11:45時点)

▼ 役に立ったらブックマークお願いします!

音声で返してくれるAI秘書を作ってみたけど…実用性はどうなの?しゃべるアシスピーの実験レポート

音声で返してくれるAI秘書を作ってみたけど…実用性はどうなの?しゃべるアシスピーの実験レポート
人気ブログランキング