OpenAI präsentiert neue Audio-Modelle: Verbesserte Sprach-zu-Text- und Text-zu-Sprach-Funktionen für Entwickler

OpenAI stellt neue Audio-Modelle vor: GPT-4o-transcribe und GPT-4o-mini-transcribe für präzisere Sprach-zu-Text-Umwandlung, ideal für Kundenservice und Meeting-Protokolle. Das Text-zu-Sprache-Modell GPT-4o-mini-tts bietet anpassbare Sprachausgabe. Preise ab 0,003 $ pro Minute. Einfache Integration in Sprachagenten durch aktualisiertes Agents SDK.

Neue Llama-4-Serie von Meta: Revolutionäre KI-Modelle mit Multimodalität und hoher Effizienz

Entdecke die Llama-4-Serie von Meta: Multimodale KI-Modelle für Text, Bild und Video. Mit Mixture-of-Experts-Architektur, hoher Leistung und optimierten Kosten setzt Llama 4 neue Maßstäbe. Erfahre mehr über technologische Eigenschaften, Leistungssteigerungen, NVIDIA-Optimierungen und die vielfältigen Einsatzmöglichkeiten von Llama 4 Scout, Maverick und Behemoth. Jetzt Open-Weight-Modelle für Entwickler verfügbar!