朝、パソコンを立ち上げたら「おはようございます。今日は10時から会議、午後は曇りの予報です」としゃべってくれるAI秘書。
そんな未来、ちょっと便利そうじゃないですか?
今回はそんな妄想からはじまり、「しゃべるAI秘書(アシスピー)」を自作してみました。
果たして実用になるのか?どんな技術を使ってどう実装したのか?試してみた結果と感想をまとめます。
▼以前作成した毎朝の情報収集をAIが行ってくれる秘書アシスピーはこちら
思いついたきっかけ:OK Googleみたいな秘書がほしい!
このアイデアの出発点は、「OK Google」や「Alexa」のような音声アシスタントが、もっとパーソナルな情報を話してくれたら便利かも?という妄想でした。
たとえば…
そう思ったのがきっかけで、「じゃあ、自分で作ってみよう」と思い立ったのです。
作った仕組み:GAS×ChatGPT×音声APIで構成
構成はざっくり以下の通りです。
-
Googleカレンダー、天気API、ニュースRSSから情報を取得(GAS)
-
ChatGPT APIで、朝のあいさつ&要約文を自動生成
-
OpenAIの音声API(TTS)で、mp3音声に変換
-
GASでmp3ファイルをGoogleドライブに保存 → HTMLから再生
たとえば「明日の予定教えて」とフォームから送信すると、
カレンダーの予定をChatGPTが自然な口調に整形し、音声で返してくれるという流れです。
音声入力は技術的にまだ厳しかったため、送信はテキスト、返信は音声というスタイルで対応しました。
▼テキストボックスに入力して送信
動かしてみた感想:正直、遅い&ぎこちない
実際に動かしてみると、まず感じたのがレスポンスの遅さです。
-
ChatGPTの生成に数秒
-
音声変換に数秒
-
mp3保存&再生にさらに数秒
結果、ボタンを押してから再生まで10秒前後かかることもありました。
また、音声の日本語がカタコトで、「日本語がうまい外国人」感が出てしまうのも気になりました。
イメージしていた「ちょっと予定教えて!」「軽く雑談して!」というような会話的な使い方には、まだほど遠く、実用性としては厳しいかな、という印象でした。
改良版:ポチっと押すと延々しゃべるアシスピー!
そこで、思い切って方向転換。
「ユーザーから話しかける形式」ではなく、
「ボタンをポチするとAI秘書が勝手に朝の情報をしゃべってくれる」構成にしてみました。
実装のポイントは以下の通りです。
元のコードを少し調整し、(元のコードはこちら↓)
-
GASの
sendMorningDigest()
(メール送信用)をgetMorningSpeech()
に変更し、テキスト出力専用に -
doGet()
でフォーム(HTML)を表示し、GAS関数を実行可能に -
ブラウザ側では
SpeechSynthesis API
を使って、mp3なしで即読み上げ
読み上げの流れは…
「おはようございます。今日は○○」→予定→タスク→天気→ニュース→主婦向けのひとことアドバイス
という、アシスピーによる“朝の読み上げラジオ”のような雰囲気になりました。
結果:これは“わりと良かった”…が、惜しい点も
この改良版、反応速度はかなり改善されました!
mp3ファイルを生成しないため、再生までの待ち時間が大幅に短縮されたのは大きなメリットです。
しかしながら、以下の点は引き続き課題でした。
-
ブラウザの読み上げがゆっくり実況っぽい(自然な会話感はまだ遠い)
-
モバイルでは再生されないことがある
-
音声に感情がなく、あくまで「読み上げているだけ」感が残る
結論:AI秘書をしゃべらせる夢は、もう少し先
今回の「しゃべるアシスピー」実験は、自分としては一区切り。
ただ、試してみたからこそわかった可能性もあります。
たとえば…
など、工夫しだいでまだまだ活用の余地はありそうです。
私は今回の構成では使わないかな…という感じですが、(このレベルの読み上げであれば今のところメールで十分)
こうしたAI秘書の試作を通して、「未来にちょっと近づいた」気がしました。
▼GASとChatGPTの連携でAI秘書を自作してみたい!という方は、こちらの書籍も参考になります
![]() |
Google Apps Script × ChatGPTのツボとコツがゼッタイにわかる本 新品価格 |
▼ 役に立ったらブックマークお願いします!