音声合成 mimi®︎ TTS

多言語に対応した高品質な音声合成API

すぐにクラウドAPIを利用したい方はこちら

開発者向けドキュメント APIコンソール

概要

クラウド型音声合成サービスである mimi® TTS は、日本語を基軸言語として NICT(国立研究開発法人情報通信研究機構)にて研究開発されている最新のニューラル音声合成エンジンを搭載し、多言語対応した音声合成機能を提供しています。対応言語数は国内随一です。

対応言語は、日本語・英語・中国語・韓国語・ベトナム語・タイ語・インドネシア語・ミャンマー語・フランス語・スペイン語・ブラジルポルトガル語・フィリピン語です。多言語対応が必要な自治体窓口等での幅広い利用実績があり、特に国内で利用されることの多い主要四言語(日英中韓)の音声合成品質において高い評価を得ています。

主観的な声の「声質」をカスタマイズする機能は敢えて持たず、標準音声として対応言語の全てにおいて高い自然性と実用性を持つことを目指しています。このため、他の商用の音声合成器に見られる、特定の人物の声で音声合成をする機能、イントネーションをカスタマイズする機能、感情的な音声を合成する機能などの「声質」を調整する機能は備えていません。その分、調整不要で簡単かつ低コストに利用可能です。

mimi® TTS の特徴

  • 日本語を基軸として開発された
    純国産音声認識エンジン
    mimi® TTS は、NICT(国立研究開発法人情報通信研究機構)による長年の研究成果に基づき開発されたサービスです。純国産の音声合成エンジンとして日本語を基軸言語として開発されているものです。

  • 専門用語の追加機能一般的な新語・固有名詞、新しい言葉遣いなどは定期的に取り込まれていますが、業界特有の用語や自社特有の用語など特殊な単語を追加することができます。音声合成処理においては、入力された文章を単語に分割した後、各単語の「読み方」を推定し、その読み方に合わせて自然な音声を合成します。この読み推定が間違ってしまうと、当然ながら意味の分からない音声が出力されてしまいます。また、単語として認識できない文字列であったり、単語区切りが一般的な区切りとは異なる文字列だったときには、周辺を巻き込んで音声合成が間違うか、イントネーションの繋がり方が明らかに不自然な音声になってしまうなどの弊害があります。これらの問題を回避するために、単語登録ができることは重要な機能です。

サンプル音声

多言語音声合成は、API コンソール から無償で簡単に試すことができます。


音声合成結果のクライアントキャッシュ

音声合成された音声データを端末で再生するとき、初回の再生時には、クラウドへの音声合成リクエスト時間と音声合成時間が必要となりますが、一度合成した音声を端末に一時的に保存(「キャッシュ」といいます)しておくことで、二度目の再生時には、即時再生を行うことができます。このように、システム全体で最もエンドユーザーに近い端末で行うキャッシュをクライアントサイドキャッシュと呼びます。

mimi® TTS では、このクライアントサイドキャッシュを許可しています。クライアントサイドキャッシュがあることで応答を高速化(即時再生)することができるだけでなく、通信量も削減することができます。クライアントサイドキャッシュは、応答文のパターンに応じて「LRU(Least Recently Used)キャッシュ」又は「LFU(Least Frequently Used)キャッシュ」として実装されます。これは、音声データをキャッシュする最大量を事前に決めて置き、最大量を超えたときには、最も過去に再利用されたもの(LRU)又は、最も利用された頻度が低いもの(LFU)から消していくという仕組みです。

なお、mimi® TTS では、利用規約においてクライアントサイドキャッシュ以外のキャッシュ行為及び再利用行為全般を原則禁止としておりますのでご留意ください。サーバーキャッシュを行いたい場合や、合成した音声データの再利用などをご希望の場合はお問合せください。

オンプレミス対応もご相談ください

エッジAI

mimiクラウドAIは、パブリッククラウドサービス上に構築されています。これらの一式と同様のシステムを、お客様のオンプレミス環境に構築することができます。例えば高セキュリティ用途・閉域網での利用や、外洋船舶・航空/宇宙等のオフライン環境で音声AI・翻訳機能を提供したいときに有効です。 当社ではクラウドの設計ノウハウを活かして、お客様のご要望に応じてソフトウェアから物理サーバーまで一式のシステム開発・提供をすることができますのでお気軽にご相談ください。

カスタマイズサービス

  • 単語・フレーズ追加

    お客様のご要望に基づき、一般的ではない単語やフレーズを登録させることができます。日本語の場合、登録したい単語とその読み方をペアで提供いただくことで登録を行うことができます。他の言語については、登録したい単語リストのみを提供いただければ、その読み方は自動推定し登録させることができます(読み方を手動で指定させることもできます)。

mimi®︎ TTS の採用事例

mimi®︎ TTS の採用事例

ロボットやデジタルサイネージ、家電製品、スマートフォンなど多数の採用実績があります。代表的な事例を紹介します。

採用事例を詳しく見る

mimi®︎ クラウドAIを
触ってみたい

ログインするだけですぐに mimi®︎ クラウドAIを無償評価利用することができます。
プログラミングの知識不要。APIコンソールでは簡単な画面で試すことができます。

mimi®︎ の
全体像を知りたい

mimi®には、クラウド上で高度な認識処理を行うクラウドAIと、
デバイス上で高速な前段処理を行うエッジAIがあります。
mimi®︎の全体像や、mimi®︎エッジAIについて知りたい方はこちら。