
Professionelle Schnell- und Vielleser kennen das Problem: Lange Texte kann ich in wenigen Minuten überfliegen und mir das Wichtigste entweder notieren oder eine KI nutzen, um die relevantesten Aspekte zu notieren (ich nutze dafür Perplexity Pro oder markiere Passagen direkt in den Dokumenten mit dem Bookmark-Dienst Diigo). Mit Video- und Audioformaten funktioniert das jedoch nicht, es sei denn es gibt Transkripte oder ausssagekräftige Gliederungen, so dass man an der gewünschten Stelle ein- und aussteigen kann. Das bieten aber längst nicht alle Podcasts und Video.
Und so muss ich a) entweder einen 60-Minuten-Podcast hören (oder ein ebenso langes Video anschauen), in dem vielleicht nur ein oder zwei interessante Zitate oder Erkenntnisse stecken. Oder b) ich nutze eine Transkriptions-Plattform. Otter kann 60 Minuten Audio oder Video innerhalb von circa 10-15 Minuten in Text verwandeln und ist bei der wortwörtlichen Wiedergabe von Inhalten sehr exakt. Für genau diesen Zweck ist Otter ist meine bevorzugte Plattform. Weniger brauchbar sind allerdings die Zusammenfassungen. Nach meiner Erfahrung kann die Otter KI nicht wirklich zwischen relevanten Passagen und Füllmaterial unterscheiden und liefert stattdessen eher gekürzte Verlaufsprotokolle. Wenn ich mich schnell über das wirklich Wesentliche in Podcasts und Videos informieren will, dann nutze ich lieber diese speziellen KI-Tools.
Für Podcasts und YouTube:
Snipd: Das Tool ist ein KI-gepowerter Podcast-Player und liefert in der Pro-Version von sich aus KI-Zusammenfassungen von Podcasts auf den gängigen Plattformen wie Spotify, Apple und Google Podcasts. Damit kann schon ich im Vorfeld entscheiden, ob ich einen Podcast tatsächlich anhören will oder ob mir die Zusammenfassung reicht.
Der Clou: Mit Snipd kann ich Podcasts, die ich aus professionellen Gründen höre, auch beim Autofahren oder Aufräumen, beim Joggen oder im Fitness-Studio hören - in Alltagssituationen, in denen ich sonst Unterhaltungs-Podcasts hören würde, bei denen ich mir nichts merken oder aufschreiben muss. Snipd macht selbstständig Notizen, während ich höre. Ich kann auch selbst welche hinzufügen, indem ich einen Button auf der App oder meine Apple Ear Buds (die weißen Ohrstöpsel) antippe. Wie bei ChatGPT kann ich die KI nach weiteren Details fragen, egal, ob ich eine Podcast-Folge gehört habe oder nicht. Die Notizen lassen sich in in andere Notizbuch-Apps wie Notion oder Readwise exportieren. Snipd hat 1 Million Podcast-Folgen im Archiv, ich kann aber auch eigene Audio-Inhalte oder YouTube-Videos hochladen.
Snipd funktioniert in 11 europäischen Sprachen aber nur auf iOS und Android, nicht auf dem Desktop. Die erste Woche ist kostenfrei, danach gibt es zwei KI-gestützte Podcast-Folgen pro Woche kostenfrei, der Chat und weitere KI-Funktionen kosten $6.99 im Monat (per Jahresabo).
Für YouTube:
Gemini Flash 2.0: Seit Ende Januar kann die neueste Version von Googles KI Gemini YouTube-Videos als Texte zusammenfassen per Chat Nachfragen beantworten. Die KI lässt sich mit Google Workspace und Github Copilot verknüpfen. Gemini Flash 2.0 ist mobil und per Desktop in 40 Sprachen verfügbar und kostenfrei.
Für Videos auf anderen Plattformen:
Dafür gibt es noch keine unmittelbare KI-Lösung. Ich umgehe das Problem, indem ich die komplette Transkription bei Perplexity Pro hochlade und dort sehr gute Zusammenfassungen und Antworten auf Detailfragen bekomme.
Welche Tools nutzt Ihr für Audio- und Videozusammenfassungen? Und über wleche Art von Tools würdet Ihr gerne mehr wissen? Über Feedback würde ich mich freuen.