M5Stack Core2 音声認識したい② Speech-to-Text APIキーが遠い

いよいよ、やりたいことの製作に進みます。

 

やりたいことは以下です。

 

1:声を出す

2:m5stackCore2でテキスト表示する

3:その表示内容によってあらかじめ設定した音を鳴らす

 

です。

 

まず、1と2をするには音声をテキストにしないといけませんね。

 

ブラウザやiPhoneではいとも簡単にやってのけてくれるので

インターネットにつながるm5stackCore2ならいとも簡単に出来ると思っていました。

 

そんなわけなかった。

 

それをしてくれる機能にGoogle

Speech-to-Textがあるというのには行きつきました。

APIというのを取得すればいいというのも、

以前、何かを作ったときに使ったことがあるのでイメージ出来ました。

 

ネットの中にはSpeech-to-TextのAPI取得についても比較的書いてある記事が多いように思いました。

 

ですが、その通りに出来るようになるのに紆余曲折曲折曲折・・・

 

APIキーに全然たどり着けない。

 

遠い

遠すぎるキー

 

ですが、困り果てて

ChatGPTに聞いたところ、その回答の通りに出来るように頑張って

進んだら手に入れました!APIキー!

 

以下に全文掲載します!

 

Google Cloud Platform(GCP)のSpeech-to-Text APIを取得する手順を説明します。以下の手順に従ってください:

Google Cloud Platformにログイン:
サイトにアクセスしてGoogleアカウントでログインします。

プロジェクトの作成または選択:
プロジェクトを新規作成するか、既存のプロジェクトを選択します。プロジェクトIDをメモしておくと便利です。

APIを有効にする:
プロジェクトを選んだら、左側のナビゲーションメニューから「APIとサービス」→「ライブラリ」に移動します。
ライブラリで「Speech-to-Text API」を検索し、見つけたら「有効にする」をクリックします。

サービスアカウントキーの作成:

左側のナビゲーションメニューから「IAMと管理」→「サービスアカウント」に移動します。
「+ サービスアカウントを作成」をクリックし、名前と役割を入力します(役割は「編集者」などに設定します)。
作成後、「キー」タブに移動し、「鍵を追加」→「新しいキーを作成」をクリックします。JSON形式のキーを選択し、「作成」をクリックします。
JSONファイルが自動的にダウンロードされます。このファイルはAPIを利用するために必要なので、安全に保管してください。
APIキーの取得:

左側のナビゲーションメニューから「APIとサービス」→「認証情報」に移動します。
「認証情報を作成」をクリックし、「APIキー」を選択します。
生成されたAPIキーをメモします。このキーを使ってAPIにアクセスできます。
UIFlowでの設定:

UIFlowを開き、プログラムにこのAPIキーを組み込む必要があります。
Speech-to-Text機能を使うブロックにAPIキーを設定するためのフィールドがあるか確認し、そこに取得したAPIキーを入力します。
これで、Google Cloud Speech-to-Text APIを使用する準備が整いました。APIキーやサービスアカウントキーを使って、UIFlowで音声をテキストに変換する機能を実装できます。」

 

もちろん、これだけで出来た訳では無く、

左のナビゲーションメニューってどれよ?とか、

サービスアカウントってどこよ?

とか、つまずくたびにネット検索を繰り返し、なんとかなったのですが

間違いなくChatGPTに頼らないと出来なかったなあと思います・・・。