表現力豊かな音声合成
きめ細かな感情タグ(悲しみ、ささやき、興奮、恥ずかしさ)により、状況に応じた正確なトーン制御が可能です。
ゼロショット音声プロンプト
5~60秒の参照音声のみで音声をクローンでき、責任ある利用を確保するための同意ガードレールが組み込まれています。
多言語対応
英語のみから15言語へ拡大し、同じ自然さと表現力を維持します。
話者一貫性
オーディオブック、ポッドキャスト、講義などの長尺コンテンツ全体で安定した音声アイデンティティを維持します。
コードスイッチング
特定の言語ペア(ヒンディー語-英語、スペイン語-英語)に対応し、現実の混合言語パターンに適合します。
前世代からの優位性
ユーザーの72%がMAI-Voice-1よりもMAI-Voice-2を好み、大幅な品質向上を示しています。
役割ベースの音声スタイル
特定のユースケース向けに、あらかじめ設定されたキャラクターボイス(例:モチベーショナルトレーナー、スポーツコメンテーター)を提供します。
MicrosoftのMAI Voice 2は、自然で表現力豊かな音声合成を実現するAI音声ツールです。バーチャルアシスタント、コンテンツ作成、アクセシビリティなどのアプリケーションでリアルなテキスト読み上げを可能にします。
Category:音声合成
Visit Link:http://microsoft.ai/news/mai-voice-2/
Tags:テキスト読み上げ、音声合成、表現力豊かなAI、バーチャルアシスタント、アクセシビリティ