Kostenlos im Mac App Store
MacWhisper: Kostenlose Mac-App nimmt auf, transkribiert und macht Gesprochenes durchsuch- und kopierbar
Die Anzahl der Anwendungen, die Projekte mit Bestandteilen Künstlicher Intelligenz auf den Mac bringen, nimmt seit wenigen Wochen deutlich zu. Auf die zahlreichen Applikationen, die zuerst den KI-Bildgeneratoren Stable Diffusion auf den Mac brachten, folgten erste Menüleisten-Apps, die den schlauen Chat-Bot ChatGPT in der Mac-Menüleiste ablegten.
Die Macher des Übersetzungsdienstes DeepL lancierten zwischenzeitlich eine neue Mac-App und ihr Write-Projekt, das Formulierungen in selbst geschriebenen Texten verbessern und Rechtschreibfehler aufspüren soll, die dem Schreiber nicht auffallen wollen.
MacWhisper im Mac App Store erhältlich
Mit MacWhisper stellte sich kürzlich dann ein erster Download vor, der eine Mac-Oberfläche zur Nutzung der KI-Spracherkennung Whisper anbot. Bei Whisper handelt es sich um ein so genanntes „Automatic Speech Recognition“-System der ChatGPT-Anbieter, das mit 680.000 Stunden an Sprachaufnahmen trainiert wurde und gesprochene Texte transkribieren kann.
Dies funktioniert vergleichbar mit der von Siri angebotenen Diktatfunktion, lässt sich aber nicht nur mit eingesprochenen Texten sondern auch mit bereits vorhandenen Audioaufnahmen nutzen. Das Audiomaterial wird von MacWhisper in 30-Sekunden-Häppchen geteilt, transkribiert und dann untereinander als kopierbarer Text angezeigt.
Optionale Pro-Version
Zudem versteht sich MacWhisper auf zahlreiche Sprachen, hat wenig Probleme mit Hintergrundgeräuschen und scheitert auch an stark akzentuierten Aussprachen nicht.
Jetzt ist MacWhisper auch im App Store erhältlich und kann in der Basisversion vollständig kostenlos genutzt werden. Wer das große Whisper-Modell nutzen und englische Texteingaben noch ein wenig schneller transkribieren möchte der kann die App auf Whisper Pro upgraden. Dies ist für einmalig 17,99 Euro möglich. Doch auch ohne In-App-Kauf hat die App das Zeug zum hilfreichen Desktop-Tool.
Stürzt bei mir einfach ab.
auf die zulässigen Formate geachtet ? War bei mir zuerst auch so; nach kurzer Konvertierung ging es sofort
Ich hatte die Mikrofoneingabe benutzt.
Klingt sehr interessant. Bleiben die Daten auf dem Rechner, oder werden die Audiodateien in die Cloud hochgeladen. Laut AppStore werden vom App-Entwickler keine Daten erfasst. Es wäre hilfreich, wenn der Entwickler explizit dazu Stellung nimmt.
Alles on device :)
Mir ist nicht ganz klar: welche Vorteile habe ich, wenn ich auf die Pro-Version upgrade? Kann mir kaum vorstellen, dass lediglich schneller transkribiert wird. Das muss es doch noch einen zusätzlichen Mehrwert geben (wird leider auch nicht in der App-Beschreibung im App-Store deutlich).
Ich nehme einfach an, dass auch das große Sprachmodell verwendet werden kann und für Englisch einfach der englische Modus aktiviert werden kann.
https://github.com/openai/whisper#available-models-and-languages