近年、テキスト翻訳の性能はますます向上しています。クラウド型機械翻訳サービスである mimi® TRA は、日本語を基軸言語として NICT(国立研究開発法人情報通信研究機構)にて研究開発されている最新のニューラル機械翻訳(NMT)エンジンを搭載し、日本語と他の言語との間で高い翻訳性能を誇ります。
対応言語は、日本語・英語・中国語・韓国語・ベトナム語・タイ語・インドネシア語・ミャンマー語・フランス語・スペイン語・ブラジルポルトガル語・フィリピン語です。多言語対応が必要な自治体窓口等での幅広い利用実績があります。
mimi® TRA は逐次機械翻訳サービスです。逐次機械翻訳とは、翻訳する文章のひとまとまりをまとめて機械翻訳器に入力する方式のことをいいます。例えば、「関東地方の明日の天気は晴れのち曇りです。」という文章があるとしたら、この文章全体を機械翻訳器に入力し、翻訳結果を得るということになります。これは言い換えれば、意味のある翻訳が得られるであろう入力文章の最低の長さを人間が決める必要がある方式です。入力されたひとつの長い文章の文脈は考慮して翻訳しますが、別々に入力された文章は関係がないものとして扱われます。
これに対して、同時機械翻訳とは、翻訳する文章を連続的に機械翻訳器に入力する方式のことをいいます。機械翻訳器の内部で、翻訳することができる単位を推定し、推定された単位ごとに翻訳をして、連続的に翻訳結果を出力していきます。例えば、「関東地方の明日の天気は晴れのち曇り、東寄りの風3メートルでしょう。関西地方の明日の天気は・・・」というように長い文章があるとき、機械翻訳器の内部では、まず翻訳可能な単位を推定します。例えば「関東地方の明日の天気は晴れのち曇りでしょう、」までで一旦翻訳可能と推定し、「Tommorow’s weather in the Kanto region will be sunny and cloudy, 」と翻訳してここまで出力します。次に、「東寄りの風3メートルでしょう。」で翻訳可能と推定し、「The wind will be from the east, 3 meters.」のように翻訳して出力します。このように先頭から翻訳可能な長さを推定して、意味的な文脈を維持しながら連続的に翻訳を継続する方式が同時翻訳方式です。
最初から文章が確定しているときは、逐次翻訳でも同時翻訳でも差はありませんが、人間の発話をリアルタイムで文字化しているとき、発話が完全に完了してから翻訳をすると、翻訳完了まで時間が掛かってしまいますし、そもそも発話完了まで待たなければなりません。発話中にも翻訳をしておくことで、翻訳完了までの時間を圧倒的に短縮することができます。
逐次機械翻訳技術を用いて連続的な翻訳を行う場合、一定の無音時間で発話を区切り、翻訳単位とみなして機械翻訳を行うことになります。このような現行方式であっても利用者が慣れることで十分実用的な UX となりますが、どの単位で翻訳するべきかということは本来機械翻訳器に推定させるべきであり、リアルタイムでの自動翻訳字幕生成や、音声通信をリアルタイム翻訳する応用などを目指して研究開発が行われています。当社はグローバルコミュニケーション開発推進協議会幹事会社の一社として同時翻訳技術の研究開発を推進しており、早期の商用サービス投入を目指して活動しています。
近年の機械翻訳精度は大幅に向上していますが、常時完璧な翻訳を返すということは困難です。人間の翻訳者が翻訳作業を行う上での下訳であれば後からチェックすることができますが、リアルタイムな対話等の応用事例では、そのようなチェックを行うことはできません。
リアルタイムでの利用において、日本語から外国語に翻訳をしたときに、その翻訳が正しいかどうかを判定することは一般には困難であり、ユーザーの利用シーンにおいて、翻訳が正しいかどうかが判然としないと利用時の不安に繋がります。
このため、「逆翻訳」というインターフェースが有効になる場合があります。逆翻訳インターフェースとは、「日本語→外国語→日本語」というように、一度翻訳された外国語を再度日本語に翻訳し、その翻訳結果をユーザーに提示するインターフェースのことです。もともとの文章と逆翻訳結果が大意一致している場合、途中の翻訳結果も大意では正しい翻訳であると推認することができます。
機械翻訳アプリケーションでは、このような逆翻訳インターフェースを使うことで、ユーザーの安心を担保することが可能になります。
日本語を基軸として開発された
純国産音声認識エンジンmimi® TRA は、NICT(国立研究開発法人情報通信研究機構)による長年の研究成果に基づき開発された逐次機械翻訳サービスです。日本を代表する純国産の機械翻訳エンジンとして日本語を基軸言語として開発されており、特に東南アジア言語に対して高い翻訳性能を持ちます。
専門用語の追加機能一般的な新語・固有名詞、新しい言葉遣いなどは定期的に取り込まれていますが、業界特有の用語や自社特有の用語など特殊な単語を追加することができます。音声認識・機械翻訳技術をビジネス応用する上で、このような専門用語を認識できることは極めて重要です。単語が登録されていないと、その単語が認識・翻訳できないだけではなく、その単語の前後も巻き込んで誤認識・誤翻訳が発生してしまうことになります。
多言語音声認識とのサーバーサイド統合機械翻訳の API では、入出力データ共にテキストデータとなりますが、mimi® TRA では、入力として音声データを取ることができます。音声データを入力として与える際には、サーバーサイドで自動的に音声認識され、機械翻訳エンジンに渡されます。音声認識結果をクライアントに返し、その後再度翻訳リクエストを送信する場合と比較して、サーバーサイドで処理が最適化されているため高速な応答を期待することができます。
mimiクラウドAIは、パブリッククラウドサービス上に構築されています。これらの一式と同様のシステムを、お客様のオンプレミス環境に構築することができます。例えば高セキュリティ用途・閉域網での利用や、外洋船舶・航空/宇宙等のオフライン環境で音声AI・翻訳機能を提供したいときに有効です。 当社ではクラウドの設計ノウハウを活かして、お客様のご要望に応じてソフトウェアから物理サーバーまで一式のシステム開発・提供をすることができますのでお気軽にご相談ください。
お客様のご要望に基づき、一般的ではない単語やフレーズを登録させることができます。単語やフレーズは、日本語とのペア(対訳)で登録することができます。音声翻訳システムとして応用する場合、音声認識側にも同じ単語やフレーズを登録しておく必要があります。
ログインするだけですぐに mimi®︎ クラウドAIを無償評価利用することができます。
プログラミングの知識不要。APIコンソールでは簡単な画面で試すことができます。
mimi®︎ 音声翻訳アプリ
mimi®︎ ASR/TRA/TTS が一つになった音声翻訳アプリを公開しています。
サンプルアプリとして開発用にこちらのソースコードを有償提供することもできるため、
お客様のアプリに容易に音声翻訳機能を組み込むことができます。
mimi®には、クラウド上で高度な認識処理を行うクラウドAIと、
デバイス上で高速な前段処理を行うエッジAIがあります。
mimi®︎の全体像や、mimi®︎エッジAIについて知りたい方はこちら。