代表 茂出木謙太郎が note に「Gemini APIがさくらVPSをはじいた。開発中アプリのAI音声を作り直した話」を公開しました。

アバターと声でやり取りする開発中アプリで、ローカルでは動いていた Gemini API の音声出力が本番のさくら VPS 上で機能しなくなった事例を起点に、原因を深追いせず単一サービスへの依存を断つ方向へ舵を切った判断を整理しています。

OpenAI・ElevenLabs を比較したうえで、アバターごとに多様な声を割り当てられる ElevenLabs を採用した経緯と、音声が落ちた際は不正確な代替で取り繕わず素直に止める設計方針を示し、複数プロバイダに対応できる構成によって利用者へ安定した体験を保つ狙いを述べています。

note で記事を読む