1件の記事が見つかりました。トピックや企業名でも横断的に探せます。
仏Mistralがオープンソース音声生成モデル「Voxtral TTS」を公開。30億パラメータ、9言語対応、スマートウォッチで動作。5秒の音声サンプルからカスタムボイスを生成し、90msで初回音声出力。ElevenLabsやOpenAIへの直接挑戦。