Text-to-Speech erzeugt M4B-Dateien
Audiblez: Freie Mac-App wandelt E-Books in Hörbücher
Mit Audiblez steht ein neues Open-Source-Tool zur Verfügung, das E-Books in Hörbücher umwandelt. Die Anwendung nutzt das Sprachsynthesemodell Kokoro, um aus EPUB-Dateien Audiodateien im M4B-Format zu erstellen.
Die Entwickler geben an, dass das Modell trotz seiner kompakten Größe von nur 82 Millionen Parametern eine natürlich klingende Sprachausgabe bietet. Um euch einen Eindruck von den möglichen Ergebnissen zu verschaffen, könnt ihr Kokoro hier im Browser ausprobieren. Das Modell wurde unter einer freien Lizenz veröffentlicht und mit weniger als 100 Stunden Audio trainiert.
Englisch, Spanisch, Französisch und Italienisch
Laut der Projekt-Webseite unterstützt Audiblez derzeit mehrere Sprachen, darunter Englisch, Spanisch, Französisch, Italienisch und Mandarin – eine deutsche Ausgabe wird aktuell leider nicht angeboten. Die Umwandlungs-Geschwindigkeit hängt von der verwendeten Hardware ab. Auf einem MacBook Pro mit M2-Chip kann mit 60 Zeichen pro Sekunde gerechnet werden. Dieser Eintrag hier würde also etwa 31 Sekunden benötigen, um in ein Hörbuch überführt zu werden
Das Programm kann unter macOS als Kommandozeilen-Tool oder mit einer grafischen Oberfläche genutzt werden. Nutzer mit Python 3 können Audiblez über den Paketmanager pip installieren. Zusätzlich sind Abhängigkeiten wie espeak-ng und ffmpeg erforderlich. Unter macOS lässt sich das Tool mit dem Paketmanager Brew installieren.
Erst WAV- dann M4B-Dateien
Zur Nutzung gibt der Anwender einen EPUB-Dateipfad sowie eine gewünschte Stimme an. Die Software erzeugt zunächst einzelne WAV-Dateien für die Kapitel und fasst diese abschließend zu einer M4B-Datei zusammen, sofern ffmpeg installiert ist. Optional kann die Lesegeschwindigkeit zwischen 0,5- und 2-facher Geschwindigkeit angepasst werden.
Audiblez wird standardmäßig über die CPU ausgeführt. Für Apple-Prozessoren ist derzeit keine Hardware-Beschleunigung verfügbar, da hier noch eine kompatible Implementierung fehlt.
Voices als Alternative
Alternativ und deutlich einfacher zu installieren bietet sich die kostenfreie Mac-Applikation Voices von Jordi Bruin an. Diese kommt jedoch mit einer signifikanten Einschränkung: Voices Nutzt kein lokales Sprachmodell, sondern kommuniziert mit den Angeboten von OpenAI-, ElevenLabs und PlayAI. Diese sind allesamt kostenpflichtig und setzen vorhandene Konten bzw. entsprechende API-Schlüssel voraus.
Ich bin auf der Suche nach einem Programm das aus PDF eine Audio Datei erstellt. Habt ihr dazu auch eine empfehlenswerte Software?
Genau. Gibt es etwas, was aus Hörbüchern EPUBs macht?
Transkription Tools gibt’s doch einige. Die einfachsten müssen dafür halt die Laufzeit des Hörbuchs einmal ablaufen lassen, was halt etwas lange dauert. Aber andere Frage dazu: von welchen Büchern gibt es denn Hörbücher von denen es keine ebooks gibt? Das hier vorgestellte Tool bedient ja ein fehlendes Hörbuch weil es noch niemand eingelesen hat, aber andersrum wüsste ich auf Anhieb ehrlich gesagt nix wo man sich nicht auch das ebook ohne transkriptionstool direkt kaufen kann wenn es schon ein Hörbuch gibt. Höchstens Podcasts könnte ich mir so vorstellen verschriftlichen zu wollen wenn man es selber lesen statt hören möchte oder nicht hören kann…
Gibt es sowas auch für windows?
Klicke auf das zweite Wort im Artikel (Audiblez). Lies die Bildunterschrift unter dem ersten Bild. Das ist nun wirklich nicht zu viel verlangt, oder?
Wo kommen denn die anderen Sprachen her? Kokomo bietet nur amerikanisches und britisches Englisch, Französisch und Hindi…?
Cool wäre natürlich wenn man sich ki basiert seinen lieblingshörbuchleser zusammenstellen kann, her das würde auch wieder rechtliche Probleme aufwerfen und künftige Gagen für Synchronsprecher und Leser erschweren
Gibt es auch was für Podcast > PDF?