Zum Inhalt springen

Schreibbüro-24 - Ihr kompetenter Schreibservice für Interview Transkriptionen

Transkriptionssoftware, automatische Spracherkennung

Spracherkennung und deren Einsatz bei der automatischen Transkription von Interviews, Videos oder Konferenzmitschnitten hat sich in den letzten fünf Jahren sehr gut entwickelt. Aber um es gleich vorweg zu sagen: Für gelegentliches oder gar einmaliges Transkribieren von Interviews oder vergleichbaren Audioaufnahmen macht eine softwarebasierte Transkription keinen Sinn. Eine Erläuterung folgt. Zunächst noch einige Fakten. Selbst Dresing & Pehl schrieben in ihrem Praxishandbuch "Praxisbuch Interview, Transkription & Analyse" im Jahr 2015 auf Seite 31 noch:

"Kann mir Spracherkennung die Arbeit abnehmen?

Leider, leider ... es geht noch nicht. Spracherkennungssoftware ist für die Verschriftlichung von Interviewaufnahmen heutzutage noch völlig ungeeignet. Wir haben das immer wieder ausgiebig getestet. Eine automatische Erkennung von Interviews oder Gruppengesprächen ist mit der zurzeit verfügbaren Software absolut unmöglich."
Zitiert nach Dresing, Thorsten/Pehl, Thorsten: Praxisbuch Interview, Transkription & Analyse. Anleitungen und Regelsysteme für qualitativ Forschende. 6. Auflage. Marburg, 2015.

Heute, sechs Jahre später, bietet die Firma  dr. dresing & pehl GmbH, sebst einen Dienst zur automatisierten Erzeugung von Transkripten mittels Spracherkennung an (https://www.audiotranskription.de/f4x). In einer späteren Auflage des o. g. Praxisbuchs haben Dresing & Pehl ihre Einschätzung aus 2015 revidiert, was zwangsläufig passieren musste, denn sonst hätte die Vermarktung des eigenen Transkriptionsdienstes sicher Schaden genommen. 

Was leisten automatische Transkriptionsprogramme wirklich?

Wir haben im Dezember 2020 sechs verschiedene Transkriptionssysteme bzw. -dienste getestet. Darunter auch den oben angesprochenen "f4x" von Dresing & Pehl. Getestet haben wir mit jeweils zwei Interviews, die uns von Kunden übermittelt wurden. Ziel der Übung war es, eine Transkription nach einfachen Regeln zu liefern. Keines der sechs getesteten Systeme lieferte eine fehlerfreie Transkription im Sinne des definierten Ziels, die wir an einen Kunden hätten weitergeben können. Bei allen Systemen musste nachgearbeitet bzw. nachkorrigiert werden. 

Fazit: Transkriptionssoftware im praktischen Einsatz

Der automatischen Spracherkennung fehlen zur Lieferung von fehlerfreien Ergebnissen noch fünf bis zehn Prozet. Für die Erstellung von gelegentlichen oder gar einmaligen Transkriptionen, etwa für eine Bachelor- oder Masterarbeit, macht die Nutzung einer solchen Software kaum Sinn. Zum einen muss eine Einarbeitung erfolgen und an einem Korrektorat geht kein Weg vorbei. Das kann man, vorausgesetzt man ist bei Rechtschreibung und Interpunktion sattelfest, natürlich in Eigenregie durchführen. Doch es bleibt ein überproportinal hoher Erstaufwand - wie eigentlich bei allen Tätigkeiten, die man erstmalig durchführt (Lernkurve).  

Ferner liefert die Transkriptionssoftware jeweils immer nur eine bestimmte Art der Transkription und nicht zwingend eine Transkription nach einem bestimmten Regelwerk. Benötigt man also eine Transkription nach den Transkriptionsregeln X (siehe unsere Seite Transkriptionsregeln), so müssen die Besonderheiten der jeweiligen Regel während des Korrektorats eingearbeitet werden. Dies bedingt aber, dass die Person, die das Korrektorat durchführt im Umgang mit den jeweiligen Regeln geübt ist. Dazu gehört Erfahrung - oder sehr viel Zeit für eine Einarbeitung. 

Anders sieht die Situation aus, wenn man die Stärken und Schwächen der unterschiedlichen Dienste kennt, bereits eingearbeitet, das benötigte Regelwerk nicht komplex ist und wenn die Audioqualität, der zu transkribierenden Datei, gut bis sehr gut ist. Gut zu verstehen bedeutet: Es gibt keine Neben- oder Störgeräuche, keine starken Dialekte, kein Rauschen, der Pegel ist nicht übersteuert oder untersteuert und es wird deutlich gesprochen. Sind diese Bedingungen erfüllt, kann man für die Transkription von Audiodateien durch den Einsatz von Spracherkennung Zeit (und damit Geld) sparen. Sind diese Bedingungen erfüllt, bieten wir im Schreibbuero-24.com die Transkription von Audiodateien (Interviews, Videotranskriptionen, etc.) über ein halbautomatisiertes Verfahren an. Zunächst wird die Datei mittels automatischer Spracherkennung transkribiert. Anschließend erfolgt eine manuelle Korrektur gem. den zuvor festgelegten Regeln. 

Sollten Sie ein Transkriptionsprojekt haben, so senden Sie uns am besten eine kurze E-Mail an: anfrage(at)schreibbuero-24.com mit Details zu Ihrem Projekt/Interview und Ihren Wünschen in Bezug auf die anzuwendenden Transkriptionsregeln.