M5Stack Core2 音声認識したい② Speech-to-Text APIキーが遠い
いよいよ、やりたいことの製作に進みます。
やりたいことは以下です。
1:声を出す
2:m5stackCore2でテキスト表示する
3:その表示内容によってあらかじめ設定した音を鳴らす
です。
まず、1と2をするには音声をテキストにしないといけませんね。
ブラウザやiPhoneではいとも簡単にやってのけてくれるので
インターネットにつながるm5stackCore2ならいとも簡単に出来ると思っていました。
そんなわけなかった。
それをしてくれる機能にGoogleの
Speech-to-Textがあるというのには行きつきました。
APIというのを取得すればいいというのも、
以前、何かを作ったときに使ったことがあるのでイメージ出来ました。
ネットの中にはSpeech-to-TextのAPI取得についても比較的書いてある記事が多いように思いました。
ですが、その通りに出来るようになるのに紆余曲折曲折曲折・・・
APIキーに全然たどり着けない。
遠い
遠すぎるキー
ですが、困り果てて
ChatGPTに聞いたところ、その回答の通りに出来るように頑張って
進んだら手に入れました!APIキー!
以下に全文掲載します!
「Google Cloud Platform(GCP)のSpeech-to-Text APIを取得する手順を説明します。以下の手順に従ってください:
Google Cloud Platformにログイン:
サイトにアクセスしてGoogleアカウントでログインします。
プロジェクトの作成または選択:
プロジェクトを新規作成するか、既存のプロジェクトを選択します。プロジェクトIDをメモしておくと便利です。
APIを有効にする:
プロジェクトを選んだら、左側のナビゲーションメニューから「APIとサービス」→「ライブラリ」に移動します。
ライブラリで「Speech-to-Text API」を検索し、見つけたら「有効にする」をクリックします。
サービスアカウントキーの作成:
左側のナビゲーションメニューから「IAMと管理」→「サービスアカウント」に移動します。
「+ サービスアカウントを作成」をクリックし、名前と役割を入力します(役割は「編集者」などに設定します)。
作成後、「キー」タブに移動し、「鍵を追加」→「新しいキーを作成」をクリックします。JSON形式のキーを選択し、「作成」をクリックします。
JSONファイルが自動的にダウンロードされます。このファイルはAPIを利用するために必要なので、安全に保管してください。
APIキーの取得:
左側のナビゲーションメニューから「APIとサービス」→「認証情報」に移動します。
「認証情報を作成」をクリックし、「APIキー」を選択します。
生成されたAPIキーをメモします。このキーを使ってAPIにアクセスできます。
UIFlowでの設定:
UIFlowを開き、プログラムにこのAPIキーを組み込む必要があります。
Speech-to-Text機能を使うブロックにAPIキーを設定するためのフィールドがあるか確認し、そこに取得したAPIキーを入力します。
これで、Google Cloud Speech-to-Text APIを使用する準備が整いました。APIキーやサービスアカウントキーを使って、UIFlowで音声をテキストに変換する機能を実装できます。」
もちろん、これだけで出来た訳では無く、
左のナビゲーションメニューってどれよ?とか、
サービスアカウントってどこよ?
とか、つまずくたびにネット検索を繰り返し、なんとかなったのですが
間違いなくChatGPTに頼らないと出来なかったなあと思います・・・。