Mysterys lösen: Das Rätsel ist in einer Sound-Datei versteckt

Errate die Melodie
Meta-Daten und Dateieigenschaften
Morse-Code als Sound
DTMF Codes entziffern
Andere Frequenzanalysen
Verfremdete Audio-Dateien
Mittels Steganografie-Programmen versteckte Informationen


Eine weitere, allerdings nicht allzuoft eingesetzte Möglichkeit ein Rätsel zu verstecken, ist es, mit einer Sound-Datei, also mit Tönen zu arbeiten.

Errate die Melodie

Eine beliebte Spielart ist es hier, eine bestimmte Melodie oder Musik zu erkennen. Das kann so etwas wie "Die Titelmelodie welcher TV-Kinderserie aus den Achtzigern war das?" sein. Oder die Hits der Lieblingsband der Owners. Mit den erratenen Titels kann man dann zum Beispiel mit den Anfangsbuchstaben der Titel ein Passwort zusammenzusetzen.

Was aber tun, wenn einem der Titel auf der Zungenspitze liegt, man aber partout nicht darauf kommen will? Da gibt es zum einem - bei einem begrenzten Themengebiet - die Möglichkeit zu googlen, etwa nach "Intro TV Serie Kinder". Und dann die Suchergebnisse durchgehen, ob einem das auf die Sprünge hilft oder weiterklicken und sich auf YoutTube und Co. die einzelnen Lieder anhören, bis man das richtige erwischt hat - was gefühlt ewig dauern kann.

Oder man benutzt eine Musik/Sound-Suchmaschine. Diese gibt es bevorzugt als App für das Smartphone, weil hier das Mikrofon schon eingebaut ist. Am bekanntestens dürfte hier die Shazam App sein. Aber ich habe auch mit der SoundHound App gute Ergebnisse erzielt.

Die Bedienung ist einfach: App starten, Musik starten und gleichzeitig eine Schaltfläche in der App antippen, Aufnahme wieder stoppen, wenn das Lied vorbei ist (bzw. geht das nach einer Weile automatisch). Die App bildet dann so etwas wie einen Hash / eine Quersumme über das Lied, guckt in seiner Datenbank nach und liefert hoffentlich passende Ergebnisse. Bei der Aufnahme sollte man Nebengeräusche vermeiden und die richtige Lautstärke bei der Wiedergabe der Musik wählen. Einfach ein bisschen Herumprobieren, bis man ein Gefühl dafür hat.

Wer keine zusätzliche App herunterladen will, der wird vielleicht überrascht sein, dass er wahrscheinlich schon eine installiert hat, zumindest bei Android-Smartphone: den Google-Assistenten kann man nämlich einfach fragen: "Welches Lied ist das?". Dazu lange auf den Home-Button tippen oder "OK, Google" sagen , bis der Google Assistent aufgeht und dann eben diese Frage stellen. Bei Siri beim Apple iPhone funktioniert das ähnlich mit "Hey, Siri" (oder lange auf den Home-Button drücken) und "Wie heißt der Song?". Amazons Alexa kann Liederkennung zur Zeit leider nur für gerade selbst abgespielte Lieder, obwohl sie ja eigentlich genug Mikrofone hätte.

Auf dem PC bzw. online, wie zum Beispiel unter https://www.midomi.com/ gibt es zwar auch Möglichkeiten, diese funktionieren aber meiner Erfahrung nach nicht so gut wie die Smartphone Apps.

Meta-Daten und Dateieigenschaften

Wie bei Grafikdateien wie JPEG-Bilder kann man auch häufig in Audiodateien Meta-Daten ablegen. Berühmt geworden dafür ist das MP3-Dateiformat, bei dem man seinerzeit dann auch mehr an Informationen wie Liedtitel, Interpret und Genre unterbringen konnte, als es über den Dateinamen alleine möglich gewesen wäre:

Unter Windows bekommt man die Metadaten am einfachsten durch einen Rechtsklick auf die Datei und dann Eigenschaften heraus, hier ein kleines Beispiel:



Hier können natürlich auch Rätsel-Hinweise und Koordinaten in den Feldern versteckt sein. Bei unbekannten Audioformaten, bei denen Windows keine Infos anzeigt, hilft eventuell wieder der Hex-Editor (siehe Mysterys lösen: Das Rätsel besteht nur aus Nullen und Einsen (oder HexCode)). Vor dem bleibt nichts verborgen.

Morse-Code als Sound

Gerne wird statt der Zeichen für den Morse-Code auch die Darstellung mit Tönen gewählt und das dann zum anhören als .MP3-Datei bereitgestellt, hier ein Beispiel mit 20 Wörtern pro Minute Geschwindigkeit, das ich mit einem Text to Audio Morse Code Converter generiert habe:

morse-sound-koords.mp3

Wenn man nicht zufällig eine Funker-Ausbildung genossen hat, wird man sich als Normalsterblicher schwer tun, da mitzukommen, selbst beim Notieren der Punkte und Striche, die für kurze und lange Signale stehen.

Aber das muss man in der Regel auch nicht. Denn auch hier gibt es für das Smartphone die passende App. Einfach mal in dem Google App Store nach "morse decoder audio" suchen. Ich habe hier als Beispiel mal der Morse Expert App herausgepickt, mit der ich ganz gute Erfahrungen gemacht habe. Allerdings muss es ansonsten still sein und der Morse-Code die richtige Lautstärke haben, dann kommt die App auch mit 20 Wörtern / Sekunde halbwegs zurecht:



Gesucht war wieder NORD VIER SIEBEN GRAD DREI FUENF PUNKT DREI ACHT NEUN OST NULL NULL SIEBEN GRAD DREI FUENF PUNKT DREI VIER EINS Oben sieht man im Wasserfall-Diagramm die eingehenden Signale. Spitzen in der Lautstärke sind rot dargestellt. Das versucht die App nun als Morse-Code zu interpretieren. Manche Buchstaben hat die App allerdings vergeigt. Da könnte es helfen, die Lautstärke noch einmal anzupassen und den Morse-Code noch einmal abspielen zu lassen. Eventuell führt das zu einem anderen Ergebnis, bei dem mehr Wörter passen.

Aber es gibt auch eine Anwendung für Windows: CwGet von Sergei Podstrigailo (UA9OV). Auf der Seite gibt es auch eine kurze Anleitung. Das Programm ist nicht ganz einfach zu bedienen, naja, zu bedienen eigentlich schon, nur wird sich jeder, der nicht gerade Funkamateur ist, fragen, was die vielen Abkürzungen zu bedeuten haben. Richtig eingestellt ist das Programm aber durchaus brauchbar:



Der Vorteil ist, dass hier nicht der Umweg über das Mikrofon gegangen werden muss, sondern direkt die Soundkarte angezapft werden kann:



Das macht die Erkennung noch einmal genauer. Ansonsten ist wichtig, den "Sp.Lock", den Speed Lock eingeschaltet zu haben. Es schadet auch nichts, sich an den Einstellungen im Screenshot oben zu orientieren und dann ein bisschen herumzuprobieren, bis man sinnvolle Buchstabenabfolgen sieht.

Was aber, wenn das Signal so schlecht ist, dass die Dekoder nichts mehr zu Tage fördern? Dann hilft nur noch die visuelle Analyse.

Dazu das .MP3 oder .WAV-File in ein Audiobearbeitungsprogramm laden. Ich benutze schon seit Urzeiten Audacity dafür und bin bei der Version 2.2.2 stehengeblieben, nachdem ich Gerüchte gehört habe, dass die neuen Versionen mehr Daten übermitteln, zumindest hält sich der Hersteller sowas in den neuen Lizenzvereinbarungen von 2021 offen. Und da ich an der V 2.2.2 nichts vermisse, lade ich mir einfach keine neue Version mehr herunter. Welche Version ihr euch herunter lädt, müsst ihr selbst wissen. Das Lesen der Lizenzvereinbarungen will und kann ich euch nicht abnehmen. Die neueste Version gibt es unter audacityteam.org. Ältere Versionen findet man, indem man danach sucht. Nachdem das MP3 geladen wurde, benutzen wir das Lupen-Symbol, um in die Audio-Abbildung hinein zu zoomen:



Nun können wir direkt sehen, wie lang die Signale sind und können selbst entscheiden, ob diese lang oder kurz sind. Für die ersten beiden Wörter notiere ich "-. --- .-. -.. / ...- .. . .-." , was mit der Morse-Code Dekoder auf Kryptografie.de zu "nord vier" übersetzt.

Mit dem Scrollbalken unterhalb, oder wenn man eine Maus mit seitlichen Scrollrad hat, damit, kann man dann bequem durch die Darstellung scrollen und die Signale dafür notieren. Im Team zu Zweit (einer sagt an, der andere schreibt) geht das natürlich noch schneller.

Mit dem Audio-Editor kann ich dann auch andere akustische Codes wie etwa den Klopf Code an der Wellenform erkennen und entziffern.

Und natürlich geht auch Binärcode - ähnlich wie Morse - ein kurzes Signal für eine Null und eine langes Signal für eine Eins. Ja, im Grunde genommen kann man so alle Rätsel kodieren, die aus Nullen und Einsen bestehen. Und so ähnlich wurden auch wirklich damals die binären Informationen, die Computerprogramme für Heimcomputer wie den Commodore C64 abgespeichert: als Audiosignal auf einer gewöhnlichen Musikkassette, allerdings noch ein Stückchen raffinierter.

DTMF Codes entziffern

Während wir Deutschen noch mit Wählscheibentelefonen rummachten, hatte die USA ihn schon lange eingeführt: den DTMF Code. Das steht für Dual Tone Multi Frequency oder zu deutsch Mehrfrequenzwahlverfahren (kurz MFV).

Dabei werden zwei Töne, ein niedriger (697, 770, 852 oder 941 Hertz) und ein hoher (1209, 1336, 1477 oder 1633 Hertz) gemischt, also gleichzeitig wiedergegeben. Das hat man getan, damit diese Töne nicht aus Versehen aus Hintergrundgeräuschen erkannt werden. Werden diese Töne in die Telefonleitung gespielt, erkennt das die Vermittlungsstelle, interpretiert sie als Ziffern und verbindet dann zur entsprechenden Telefonnummer, sobald die Nummer vollständig ist.

Früher funktionierte das auch, indem man einfach den Telefonhörer abnahm und die DTMF-Sequenz für die Nummer vorspielte. Das könnte auch heute noch funktionieren und da hätte wir auch schon die erste Art, DTMF-Nummern zu dekodieren: nämlich durch das Telefon selbst.

Denn bei manchen Rätsel erhält man eben ein Audio-File mit einer DTMF-Sequenz, um die dort enthaltene Nummer anzurufen. Am Ende geht dann ein Anrufbeantworter ran und sagt einem die Koordinaten oder den nächsten Rätselteil. Ich persönlich habe da immer ein bisschen ein schlechtes Gewissen... was wenn man noch um Mitternacht etwas rätselt, sich bei einer Ziffer vertut und dann bei einer arme Omi durchklingelt, die dadurch aus dem Bett gescheucht wird? Darum bitte lieber zwei oder dreimal prüfen, bevor man wo anruft. Und vorher die Kosten checken, wenn es um Auslands oder Sonderrufnummern geht.

Moderne Telefone reagieren aber normalerweise nicht mehr auf DTMF-Signale von außen, sondern man muss sie dort über die eigenen Tasten eingeben. Das ist sicherer, sonst könnte ja jeder teuere Sonderrufnummern durchs Radio abspielen und jeder, der gerade den Sender hört und das Telefon abnimmt würde die teure Nummer wählen. Da müssen wir uns dann etwas anderes einfallen lassen.

Als Beispiel nehmen wir: dtmf-nummer.wav

Und zum Dekodieren nehmen wir die Android App DTMF Decoder von EncapSystems, mit denen ich gute Erfahrungen gemacht habe. Einfach die App starten und dann die Sounddatei mit den DTMF-Tönen abspielen und prompt wird das Ergebnis geliefert:



Bei schnellen Abfolgen funktioniert der Dekoder allerdings nicht immer super genau und verschluckt ganz gerne mal eine Ziffer. Eventuell hilft mehrmals abspielen und in unterschiedlichen Lautstärken oder das Smartphone anders zu positionieren.

Hilft das immer noch nichts, weil das DTMF-Signal vielleicht ein bisschen verrauscht ist, hilft wieder die visuelle Interpretation mit Audacity. Dazu das DTMF-File laden und eine einzelne Sequenz markieren. Ich habe jetzt mal die zweite für die Ziffer Acht genommen. Dann auf Analyse / Spektrum klicken, um die Frequenz-Analyse zu öffnen:



Hier werden jetzt alle Frequenzen angezeigt, aus dem unser Signal besteht. Die zwei Spitzen zeigen uns, dass zwei Hauptfrequenzen den Ton angeben. Und wenn man mit dem Mauszeiger in die Mitte der Spitzen fährt, wird unterhalb bei "Cursor" die jeweilige Frequenz angezeigt. Ich habe dort mal eine gelbe Linie eingezeichnet bei 857 Hertz. Der zweite Peak liegt bei etwa 1335 Hertz.

Nun nehmen wir uns die Tabelle vom DTMF Code her:



In der Kombination 857 (genau eigentlich 852) und 1335 (genau eigentlich 1336) finden wir dann laut Tabelle die Ziffer 8. Nun machen wir mit der nächsten Ziffer auf die selbe Art und Weise weiter. Bei den Signalen, die absolut gleich aussehen, können wir uns die zweite Dekodierung sparen. Trotzdem kann das in eine Felißarbeit ausarten. Dafür führt es aber immer zum Erfolg, weil wir selbst entscheiden können, zu welcher DTMF-Frequenz ein Peak jetzt gehört. Und die Frequenzen liegen ja immer so um die 100 Hertz auseinander. Da sollte man eine eindeutige Zuordnung treffen können.

Andere Frequenzanalysen

Aber auch die Analyse anderer Frequenzen kann helfen. Zum Beispiel könnte jemand auf die Idee kommen, eine Koordinate als Klaviernoten zu dekodieren, also als A, B/H, C, D, E, F, G, um damit dann etwa die Zeichen von Kennyspeak oder ShortOok zu ersetzen.

Und der Cacher bekommt nur eine MP3-Datei mit einem schräg klingenden Klavierstück vorgesetzt. Dann hilft der selbe Trick: Man kann die jeweilige Frequenz eines Tones mithilfe der Frequenzanalyse in Audacity ermitteln und dann in der Liste der Frequenzen aller Töne der Klaviertastatur bei Wikipedia nachschauen, zu welcher Note diese gehören.

Verfremdete Audio-Dateien

Auch bei verfremdeten Audio-Dateien kann Audacity mit seinen vielen Effekten helfen. Zum Beispiel, wenn man eine rückwärts abgespielte Sounddatei vor sich hat. Das man so einen Fall vor sich hat, hört man eigentlich schnell heraus, weil am Ende der Wörter die "Stimme" nicht nach unten geht. Das Gegenmittel: einfach mit Audacity nochmals rückwärts abspielen. Rückwärts plus rückwärts ergibt normal und man kann die Botschaft ganz normal anhören.

Ähnliches gilt, wenn man etwas ganz lang gezogenes hört. So langgezogen, dass man die einzelnen Silben nicht mehr verstehen kann. Da hilft dann schneller Abspielen. Andersherum kann einem das verlangsamen auch helfen. ISt der Morse-Code zum mitschreiben zu schnell? Einfach auch 50% oder 25% Geschwindigkeit abspielen und man kommt auch mit dem Schreiben wieder mit.

Mittels Steganografie-Programmen versteckte Informationen

Hier gilt das Gleiche wie bei den Grafik-Formaten: man kann unhörbare Tonabweichungen einweben, um so zusätzliche Informationen zu verstecken. Auch dafür gibt es Programme wie "mp3stego" oder "MP3Stegz". Aber auch noch zahlreiche andere. Und diese müssen alle heruntergeladen, installiert und ausgeführt werden. Was die Gefahr erhöht, sich eventuell einen Computervirus einzufangen.

Ich bin froh, dass Steganografie beim Geocaching nur noch selten vorkommt. Und ich möchte diese auch nicht wieder aufleben lassen, indem ich hier vielleicht detailierte Linkliste der Programme angebe. Lassen wir die Steganoprogramme in Frieden ruhen, es ist besser so.