クラウドAI

柔軟なカスタマイズに対応したビジネス向け音声AI

すぐにクラウドAPIを利用したい方はこちら

開発者向けドキュメント APIコンソール

mimi®クラウドAI

多言語音声認識、感情認識、機械翻訳、音声合成など幅広い音声応用をカバーしています

当社では2010年代から、B2Bでの音声UI構築事業を行ってきました。スマートフォンや家電製品、対話ロボット、デジタルサイネージなど、当社が携わった製品は数多くあります。その事業の中で必要となり自社開発・共同開発したコア技術群や、NICT(国立研究開発法人情報通信研究機構)の研究成果に基づくコア技術群を、クラウドAPIとして使いやすい形で幅広く提供しています。

これらのAPIは単独で利用することもできますし、複数を組み合わせて利用することや、他社のAIサービスと組み合わせて利用することもできます。ただし、理想的な音声UXを実現するためには、これらのキーテクノロジーをどのように組み合わせるかという全体設計が肝要です。個別にどれだけ優れたクラウドAIを利用しようとも、組み合わせの設計が不十分であれば、優れた顧客体験を実現することはできません。

mimi®︎ クラウドAIは、当社の音声UI構築事業の中で実際に使われ、叩かれ、洗練されてきた音声AI技術の集大成です。ビジネス現場で典型的に必要になるカスタマイズ機能や、大規模利用時にも低コストで提供できる仕組みなどを備え、ビジネス用途で利用しやすい様々な工夫がなされています。

NICT(国立研究開発法人情報通信研究機構)の研究成果に基づく多言語対応数は国内トップクラスであり、特に東南アジア言語に対する認識・翻訳精度は世界トップクラスです。APIコンソールにログインしていただくと、無償で評価利用を行うことができます。

  • 音声認識 mimi®︎ ASR

    多言語音声データを解析しテキスト化するサービスです。
    多言語対応数は国内トップクラスです。

    詳しく見る・デモを試す
  • 機械翻訳 mimi®︎ TRA

    NICT のニューラル機械翻訳技術に基づくテキスト翻訳サービスです。
    特に東南アジア言語に対する翻訳精度は世界トップクラスです。

    詳しく見る・デモを試す
  • 音声合成 mimi®︎ TTS

    NICT のニューラル音声合成技術に基づく多言語音声合成サービスです。
    多言語での自然な発話を実現することができます。

    詳しく見る・デモを試す
  • 話者認識 mimi®︎ SRS

    事前学習に基づく話者認識サービスです。事前に音声を学習させた話者が所属する話者グループの中から、音声によって話者を特定します。

    詳しく見る・デモを試す
  • 態度認識 mimi®︎ AIR

    音声のパラ言語(音声のイントネーションや声色)に込められた話者の発話「態度」を認識するサービスです。

    詳しく見る・デモを試す
  • 感情認識 mimi®︎ EMO

    音声から話者の「感情」を推定するサービスです。喜怒哀楽だけでなく、カスタム感情を定義することができます。

    詳しく見る・デモを試す
  • 言語識別 mimi®︎ LID

    短い音声から言語を推定するサービスです。多言語音声認識と組み合わせて利用することで事前の言語指定を不要にします。

    詳しく見る・デモを試す

mimi®︎ クラウドAIを
触ってみたい

ログインするだけですぐに mimi®︎ クラウドAIを無償評価利用することができます。
プログラミングの知識不要。APIコンソールでは簡単な画面で試すことができます。

mimi®︎ の
全体像を知りたい

mimi®には、クラウド上で高度な認識処理を行うクラウドAIと、
デバイス上で高速な前段処理を行うエッジAIがあります。
mimi®︎の全体像や、mimi®︎エッジAIについて知りたい方はこちら。

よくある質問

料金体系はどのようになっていますか?従来の標準料金は有効ですか?
お客様のビジネスやご利用計画に合わせたリーズナブルな料金体系を提案いたしますので、お気軽にお問合せください。
世界的な巨大IT企業群が提供するAPIサービスと比較してどのような違いがありますか?
性能面では、最近では各社とも認識性能に大きな差はなくなりつつあります。当社サービスは日本語を基軸とした研究開発成果に基づくため、日本語を含む東南アジア言語に対する認識・翻訳性能は高い傾向があります。この反面、中国語や英語の方言対応やインドの地方言語などを含む対応言語数の幅では、世界的な巨大IT企業が優れます。コスト面では、小規模利用の場合、世界的な巨大IT企業が優れる場合が多くなりますが、規模が大きくなるにつれて当社の方が優れる傾向にあります。
また、エンタープライズ向けの利用で柔軟なカスタマイズ性や高いセキュリティが必要になる場合は、巨大IT企業のサービスはそもそも利用することができない場合もあります。
当社では、自社製品に過度に拘ることなく、各社の特徴を踏まえてお客様の開発したいシステムに最適な提案をいたしますので、お気軽にご相談ください。
〇〇社と比較して、どちらが性能が良いですか?
前述の通り、最近では各社とも大きな性能差はなくなりつつあります。 そもそも認識性能はどのようなデータが与えられるかによって大きく変わります。つまり、使用される環境や発話される内容(分野)、入力データの品質などによってバラツキが大きく、一概にどのAIエンジンが優れていると断じることはできません。より重要なこととして、適切なマイク系や前段処理、認識モデルカスタマイズ等を含めた全体設計が性能に大きな影響を与えるため、AIエンジン単体の性能は、全体の一部でしかないと言えます。
実際のテストデータがある場合は、APIコンソールを利用して無償評価利用を行うことができますので、そのデータで試すことができます。しかしその結果は、標準認識モデルかつ適切な前段処理等もなされていない「素の」結果であるため、目的とする開発に対して適切な比較や評価になっていない可能性もあることに留意してください。
他社と取り組んで一度失敗しているのですが、御社では実現できる可能性はありますか?
当社を発見してくださりありがとうございます!このようなお問合せは過去に何回も頂いております。当社は音声技術に関して高い知見を保有しており、他社が見落としている観点に気づくことができるかもしれません。まずは内容と、もしよろしければ残っている予算額を教えてください(^_^)
mimiクラウドAIラインナップにはない、新しい〇〇のような音声AIを開発することはできますか?
はい、当社のR&Dソリューションでは、お客様と共同で全く新しい音声AIの研究開発を行うことができます。お客様の事業貢献を第一に、最先端でありながら同時に実用に資する研究活動を誠意を持って行います。
mimiクラウドAIのセキュリティや個人情報保護はどうなっていますか?
当社はプライバシーマークを取得し、お客様の個人情報保護を重視しております。mimiクラウドAIは、パブリッククラウドサービス上に構築されたSaaSであり、そのようなSaaSが満たすべきセキュリティ水準を達成しています。
mimiクラウドAIを日本国外から利用することはできますか?
はい、可能です。そのような実績もございます。サーバーが国内にあるため、国外から利用する場合、通信時間分の遅延が発生しますが、APIの性質上、適切に設計されたクライアントシステムでは、通信時間分の遅延はAPIの実効速度性能に大きな影響を与えません。

オンプレミス対応もご相談ください

エッジAI

mimiクラウドAIは、パブリッククラウドサービス上に構築されています。これらの一式と同様のシステムを、お客様のオンプレミス環境に構築することができます。例えば高セキュリティ用途・閉域網での利用や、外洋船舶・航空/宇宙等のオフライン環境で音声AI・翻訳機能を提供したいときに有効です。 当社ではクラウドの設計ノウハウを活かして、お客様のご要望に応じてソフトウェアから物理サーバーまで一式のシステム開発・提供をすることができますのでお気軽にご相談ください。

その他のテクノロジー

mimi®︎ クラウドAIと組み合わせて利用することが有効なテクノロジーがあります。

エッジAI

高騒音環境にも対応した多機能組込テクノロジー

エッジAI

Garbage In Garbage Out と言われるようにどれだけ高性能なクラウドAIを用いたとしても、入力データの品質が悪ければ正確な認識を行うことはできません。開発する音声サービスはどのような環境で使用されるでしょうか?
人混みの中?同時に大勢が話す?工事現場の騒音がある?環境に合わせた前段処理を行うことで、クラウドAIの性能を最大限引き出すことができます。
mimi®︎ エッジAIは、累計200万台を超える豊富な搭載実績を持つ「現場で使える」音声認識のためのキーテクノロジーです。

詳しく見る

音声デバイス

従来は正確な音声認識が困難だった場面にも適用可能な専用ハードウェア

デバイスキット

ロボットやデジタルサイネージの音声対応に最適な組込型マイクアレイ、高騒音な現場作業の音声認識に最適なウェアラブルデバイスなど、従来は正確な音声認識が困難だった場面にも適用できる音声デバイスを提供しています。
当社のソフトウェア・ハードウェア一体開発ノウハウが詰め込まれたユニークなホワイトラベル製品群であり、当社のAI技術と組み合わせることで最大の性能を発揮しますが、他社のソフトウェアと組み合わせて利用することも可能です。

詳しく見る