フロントエンド処理のソフトウェア実装。質の良い音声データを取得するために必須の技術です。
Voice Activity Detector の略であり、ニューラルネットワークにより与えられた音声から人間の声の区間を抽出する機能です。
Localizer の略であり、複数マイクを利用して音源方向を推定する機能です。
Beamformer の略であり、複数マイクを利用して特定方向から到来した音声のみを強調し、その他の音声を弱める機能です。
Echo Canceller の略であり、スピーカーから出力される音声がマイクに回り込むことを防止する機能です。
Noise Reduction の略であり、モノラル音声信号に含まれる定常ノイズ成分を推定し、ノイズを弱める機能です。
ログインするだけですぐに mimi®︎ クラウドAIを無償評価利用することができます。
プログラミングの知識不要。APIコンソールでは簡単な画面で試すことができます。