Die hier verwendete Analysemethode wird bei der Analyse monoalphabetischer Chiffren angewendet. Sie funktioniert nur für Chiffrate von englischem oder deutschem Standardtext, bei dem die Leerzeichen im verschlüsselten Text erhalten sind (siehe Dialog Textoptionen).
Im folgenden wird die Analyse für englischen Klartext beschrieben. Für deutschen Klartext funktioniert die Analyse entsprechend: Hier ergibt sich aufgrund statistischer Eigenschaften der deutschen Sprache jedoch ein etwas anderes Zahlenmaterial. Um die Beschreibung des Analyseverfahrens nicht zu sehr zu abstrahieren, wird nun die Analyse basierend auf dem Zahlenmaterial für englischen Klartext beschrieben:
Die Analyse für englische Klartexte basiert auf der Tatsache, dass ein aus einem englischen Standardtext beliebig herausgezogenes Wort mit einer Wahrscheinlichkeit von 0,5 in der Liste der 135 häufigsten englischen Wörter enthalten ist.
Zu Beginn wird der zu analysierende Text in einzelne Wörter zerlegt. Jedes einzelne Wort wird darauf überprüft, ob es in der Liste der 135 häufigsten Wörter ein Wort gibt, das dasselbe "Muster" (Pattern) aufweist.
Mit Muster ist hierbei gemeint, dass zum Beispiel erster und dritter Buchstabe gleich sind oder dass alle Buchstaben verschieden sind. So haben die Wörter "der", "dem", "von" und "ein" alle dasselbe "Muster" (jedes Wort besteht aus drei verschiedenen Buchstaben), die Wörter "alle" und "Fall" unterscheiden sich aber in ihren Mustern.
Wörter, die kein passendes Gegenstück in der Liste haben, werden nicht betrachtet. Alle anderen Wörter werden nach Mustern sortiert und zu Mengen (mit gleichem Muster) zusammengefasst. Jeder dieser Menge wird jetzt die Menge von Wörtern der Liste zugeordnet, die dasselbe Muster aufweisen.
Jedes Paar aus Wörtern aus einander zugeordneten Mengen induziert nun eine partielle Substitution. Partiell bedeutet hierbei, dass nicht unbedingt für jeden Buchstaben dabei die entsprechende Ersetzung gefunden werden muss. Vielmehr kann es passieren, dass man über die Zuordnung einzelner Buchstaben keine Aussage machen kann.
Über einen Suchbaum, der durch Tiefensuche abgesucht wird, wird nun die (partielle) Substitution gesucht, die aus den meisten Einzel-Substitutionen zusammengebaut ist, ohne dass es dabei zu Kollisionen (d.h. Widersprüchen) kommt.
Um einem exponentiellen Aufwand beim Durchsuchen des Baumes vorzubeugen, werden Äste, bei denen es im oberen Bereich zu Kollisionen kommt, nicht weiter abgesucht.
Buchstaben, die nicht zugeordnet werden konnten, werden im Ergebnistext durch Kleinbuchstaben repräsentiert. Buchstaben, für die eine Ersetzung gefunden wurde, durch Großbuchstaben.
Bemerkung:
Diese Methode ist nicht sehr performant und sie bedingt, dass Leerzeichen als Worttrenner im Geheimtext erhalten bleiben.