Automatische Gruppierung nach Sprechern
MacWhisper 12: Automatische Sprechererkennung jetzt verfügbar
Die Mac-Anwendung MacWhisper, die Audioinhalte in Windeseile verschriftlichen kann, freut sich über die Aktualisierung auf Version 12, die eine lang erwartete Funktion mitbringt: die automatische Sprechererkennung. Diese soll insbesondere für Interviews, Podcasts und Meeting-Aufzeichnungen nützlich sein.
Automatische Gruppierung nach Sprechern
Nach Angaben des Entwicklers Jordi Bruin ist es mit Version 12 möglich, Sprecher in Transkriptionen automatisch zu identifizieren und deren Aussagen entsprechend zuzuordnen. Voraussetzung dafür ist die Nutzung eines kompatiblen Modells. Die Funktion steht Nutzern der kostenpflichtigen Pro-Version zur Verfügung.
Parallel zur neuen Version gibt es ein zeitlich begrenztes Angebot: Die Pro-Lizenz kann aktuell mit einem Rabatt von 15 Prozent erworben werden. Der Einmalkauf der Anwendung ist damit für rund 50 Euro möglich.
Verbesserungen und Fehlerkorrekturen
Neben der automatischen Sprechererkennung bringt MacWhisper 12 verschiedene Optimierungen und Fehlerbehebungen. So unterstützt die Software nun weitere Modelle des Anbieters Deepgram, darunter auch ein speziell für den medizinischen Bereich trainiertes Modell. Eine weitere Neuerung ist die automatische Speicherung von Transkriptionen im .whisper-Format, die derzeit optional aktiviert werden kann und künftig als Standard vorgesehen ist.
Zudem wurde die Nutzerfreundlichkeit in mehreren Bereichen verbessert. Beispielsweise lassen sich versehentlich gelöschte Sprecher nun wiederherstellen, auch die Wortsuche im Transkript wurde optimiert. Auch das Diktieren wurde weiterentwickelt, sodass die Künstliche Intelligenz nicht mehr automatisch auf gesprochene Eingaben reagiert.
Jordi Bruin betont, dass weitere Verbesserungen in Arbeit seien. Nutzer der Pro-Version haben die Möglichkeit, Feedback zur neuen Funktion zu geben, um deren Erkennung und Zuordnung weiter zu optimieren.
Ist die pro Version deutlich besser als die kostenlose? Bei der kostenlosen Version fand ich die Sprachenerkennung jetzt nicht überwältigend…
+1
Die sind Verbesserung würdig. Vielen Dank.
Interessant, dass ihr das so seht! Ich finde sie schon sehr gut, vor allem, wenn man ein gutes Modell einsetzt. Kennt ihr eine bessere Software, die zudem noch eine Sprechererkennung hat? Wäre für Tipps sehr dankbar.
Ich arbeite mit Sembly.ai und bin ziemlich zufrieden.
Ich komme mit Macwhisper sehr gut klar. Transkribiere damit Vorträge, YouTube Videos und Zoom Meetings. Was dabei rauskommt ist sehr gut weiterverwertbar.
In letzter Zeit hab ich Probleme mit der Ausgabe von
„Vielen Dank“ anstatt meinem Gesprochenen. Keine Ahnung woran das liegt.
Bei Diktaten starten neue Sätze oft klein und viele Substantive sind klein geschrieben. Ist aber immer noch wesentlich besser als Siri und schneller als selber tippen.
Es geht um Sprecher, nicht Sprache erkennen.
Ich nutze die Pro Version täglich und finde die einzigen Fehler bei Städtenamen, Nennung von Marken etc. Da war ich bislang davon ausgegangen, das es an meiner Aussprache liegt, da ich einen Schlaganfall hatte und etwas undeutlich spreche. Ansonsten nervt mich eher, dass die Grammatik mal funktioniert und an anderen Tagen gar nicht, ohne etwas an den Einstellungen geändert zu haben. An manchen Tagen ist alles klein geschrieben.
Ich habe unter Windows jahrzehntelang mit Dragon Naturally Speaking (Nuance) gearbeitet. Geniale Ergebnisse. Gibt es leider nicht für MacOS. Hat jemand vergleichbare Erfahrungen und könnte vergleichen/empfehlen?
Als Hörgeschädigter benutze ich es, um Untertitel zu erzeugen.
Leider verhalten sich dabei alle neuen Versionen, auch die Version 12, schlechter als die alten Versionen. Es werden Teile nicht übersetzt, vor allem nach Musikpassagen, oder es kommt zu Hängern, wo dann eine Weile immer wieder derselbe Text wiederholt wird. Ich verwende weiterhin Version 4.01, die fast perfekte Untertitel (bei deutscher Sprache) erzeugt. Die ganzen neuen Features nutzen nichts, wenn die Basisfunktion nicht mehr gut funktioniert.
Ich brauche soetwas genau in die andere Richtung. Also text2speech. Am liebsten eine mac app. Kennt jemand was?