Основні характеристики наступні.

Деякі статистичні характеристики природних мов.

Статистичний підхід до аналізу шифрів заміни та гамування.

Загальний метод» дешифрування шифру перестановки.

Стійкість шифрів перестановки прямо пов'язана з методами генерації ключів. Однак для цього типу шифрів існують загальні недоліки, що можуть бути використані для їх дешифрування.

Насамперед, статистика частот входження знаків шифртекста співпадає зі статистикою відкритого тексту, незалежно від степеня підстановки. Крім того, очевидно, довгі повідомлення необхідно розбивати на блоки, що відповідають типовим довжинам ключів (степенів підстановок).

Ці особливості дозволяють визначити тип шифру та обмежити можливі довжини ключів по сукупності шифртекстов.

Крім того, існує окремий випадок, що дозволяє дешифрувати комплект криптограм однакової довжини, що зашифровані одним ключем.

Для цього досить підписати криптограми комплекту друг під другом і комбінувати стовпчики, одержуючи у групі стовпців сполучення, що читаються (притаманні мові). Чим глибше стовпчик, тим легше підібрати текст.

Даний підхід не залежить від складності перестановки.

 

 

Під статистичною характеристикою мови будемо розуміти кількісну характеристику кожної властивості, що виявляється як тенденція при масовому рівноймовірному виборі повідомлень, записаних у деякому алфавіті.

1.Словниковий склад. Мови відрізняються за словниковим складом. У письмовій мові деякі слова мають однакове написання у різних мовах (але не обов'язково той самий зміст). Звичайно потрібна невелика кількість тексту, щоб з’ясувати мову переписки. Зауважимо, що для ЕОМ задача визначення мови на основі короткого тексту є досить складною.

2. Частоти входження знаків.

При великій кількості матеріалу можна скласти типові діаграми частот входження знаків тексту, що можуть бути використані для визначення мови переписки. При цьому слід враховувати наявність або відсутність знака пропуску.

Тут виникають три моменти: нестійкість діаграм для малих вибірок, їхня залежність від спеціалізації словника і близькість діаграм деяких мов.

3. Частоти зустрічальності -грам. На їхній основі можна побудувати ефективні критерії автоматичного розпізнавання відкритого тексту.

4. Статистичні особливості в періодичних вибірках відкритих текстів, а також особливості початків і закінчень слів.

Кодові слова, що представляють символи відкритого тексту, можуть мати закономірності (наприклад, статистична перевага одиниці в старшому розряді для коду ASCII). Періодична вибірка допомагає виявити відповідні особливості.

5. Повторення слів і відрізків відкритого тексту. У даному випадку важливий факт наявності повторень та їх взаємне розташування.

6. Статистичні особливості в колонках комплекту підписаних друг під другом відкритих текстів (т.зв. вертикальні -грами).