А ОЛ (В ОЛ (АВ О

Добавление нулей

Ряд алгоритмов целочисленной арифметики и теории матриц оказывается достаточным (без нанесения сколь-либо существенного ущерба идее алгоритма и его качеству) описать для случая, когда размер

!См., например, [4].

§ 27. Добавление нулей 173

входа есть число вида 2^к. При использовании стратегии «разделяй и властвуй» это облегчает и описание алгоритма, и анализ его сложности. С теоретической точки зрения для задачи умножения двух целых чисел а и Ъ мы можем предполагать, что битовая длина каждого из данных чисел равна 2^к, где

fc = max{[log₂ А(а)1, flog₂A(b)l}, (27.1)

так как всегда возможно добавить спереди любого из данных чисел некоторое количество нулей. Если речь идет об умножении квадратных матриц А и В произвольного порядка п, то мы можем добавить к матрицам несколько нулевых строк и столбцов так, чтобы сделать их порядки равными 2^Г¹^о^&^п¹:

A0 B0 AB0 00 00 00

О 00 00 О (27.2)

(нулями обозначены нулевые блоки соответствующего размера). Несмотря на переход от начальных данных к более громоздким, некоторые из алгоритмов, основанных на стратегии «разделяй и властвуй» и использующих этот переход, имеют существенно меньшую сложность, чем наивные алгоритмы.

Предложение 27.1.Пусть вещественная функция f натурального аргумента такова, что /(п) =/(2^г¹^о&"1) для всех neN+ и

/(2^fc)^

u, если k=0,

wf(2^k^-1) +ϕ(2^k), если k >0,

при fceN, где u,w — вещественные числа, причем и^О, w^l, a ip — неотрицательная функция, определенная для всех п е N+. Тогда при всех п е N⁺ выполняется неравенство (и, если п = 1, /Тп-П Пое.п ___________ (²⁷.³)

^_/gij^ +^(2nog2ni)₎ если_п>1_

Доказательство. Легко видеть, что

|"log₂|"|]]=riog₂nl-l. (27.4)

В самом деле, если 2^к-^г < п s= 2^к, к > 1, то 2^к-² < Г|1 s= 2^к-^х, т. е. если [log₂nl=fc, то riogJ|ll =к-1. Для случая n = 2^rlo&ⁿ^l неравенство (27.3) выполнено по условию, для остальных случаев используем равенства /(n) = /(2^rlo&ⁿ^l), /ГГ-11 = /(г¹"¹⁰^¹""/²"¹"¹) = /(2^rlog2^п^_|-¹). □

174 Глава 6. Рекуррентные соотношения и сложность алгоритмов

Теорема 27.1.Пусть вещественная функция f натурального аргумента такова, что /(п) =/(2^г¹^о&"1) для всех neN+ и

Я2Ц

и, если к = 0,

wf(2^fc-¹)+c(2^fc)^d, еслик>0,

при fc е N, где и,d ^ О, о О, w ^ 1. Тогда при рассмотрении f как функции, определенной для всех п е N+ выполняются оценки

(o(n^dlogn), если d = log₂w,

f(n) = \o{n^d), если d>log₂w,

[о(п¹^о&^№), если d<log₂ мл

Доказательство следует из предложения 27.1 и теоремы 26.1. □

Подобно тому, как доказательство теоремы 26.1 было преобразовано в доказательство теоремы 26.2, из приведенного выше доказательства мы можем получить доказательство следующей теоремы

Теорема 27.2.Пусть вещественная функция f натурального аргумента такова, что /(п) =/(2^г¹^о&"1) для всех neN+ и

/<2Ц

и, если к = 0,

wf(2^fc-¹)+c(2^fc)^d, еслик>0,

где и, d ^ 0, о 0, w^ 1. Тогда для функции f{n), при рассмотрении ее как функции, определенной для всех п е N+ выполнено

fn(n^dlogn), если d=log₂w,

f{n) = I П(п¹^о& ^w), если d > log₂ w,

[n(n^d), если d<log₂w.

Перейдем к примерам.

Пример27.1 (умножение Карацубы).Пусть а и Ъ — целые положительные числа битовой длины т = 2^к. Положив Z = 2^fc-1, можем записать

a = e2^l+f, b = g2^l+h,

где e,f,g,h — целые числа битовой длины Z. А.А.Карацубе принадлежит замечательное наблюдение, позволяющее вычислить произведение ab, выполнив всего три умножения чисел половинной длины, несколько сдвигов (домножений на 2^т и 2¹) и несколько аддитивных операций над числами битовой длины s= 2т:

аЪ = eg2²¹ + ((е + /) (g + К) - eg - fh)2^l + fh, (27.5)

§ 27. Добавление нулей 175

тогда как обычное раскрытие скобок в (e2^l + f)(g2^l + К) требует выполнения четырех таких умножения:

ab = eg2^2l + (eh + fg)2^l+fh. (27.6)

Мы видим, что формула (27.5) использует произведения eg, fh, (e + /)(g + h), а формула (27.6)—произведения eg,eh,fg,fh.

Небольшая проблема, которая выше была замаскирована словами «половинная длина», состоит в том, что битовая длина любого из чисел e + f, g + h, входящей в произведение (е+ /)(# +ft), может оказаться равной Z +1, а не Z. Но если

e + f = e_x2^l+f_x, g + h = g₁2^l + hi,

где e₁,g₁ — однобитовые числа (0 или 1), то

(е + f)ig + K)= e_lg_l2²¹ + (e_xh_x + g₁/₁)2^l + f_xh_x. (27.7)

Произведение Л 7^ вычисляется рекурсивным обращением к алгоритму, произведения e₁g₁,e₁h₁,g₁f₁, как и все сложения и сдвиги, требуют 0(1) операций.

Равенство (27.5) и предположение, что т = 2^к, приводят к рекурсивному алгоритму Карацубы умножения целых положительных чисел (будем обозначать этот алгоритм буквами KM: первая из этих букв — начальная в фамилии автора алгоритма, вторая — в английском слове multiplication —умножение). Предположение т = 2^к приводит к следующему соотношению для битовой сложности умножения Карацубы:

( 1, если т = 1,

ГтЛ (27.8)

ЗГ_КМ1 у I +ст, еслит>1,

где с — некоторая положительная константа.

Умножение Карацубы при произвольном входе a, b е N+ размера т = шах{А(а), А(Ь)} предполагает, что сначала мы находим к = = [log₂ml, затем добавляем спереди каждого из а,Ъ некоторое количество нулей так, чтобы битовая длина каждого из сомножителей стала равной 2^к, а после этого используем рекурсивный алгоритм, основанный на (27.5).

Мы можем применить теорему 27.1 (w = 3, d = 1), так как при произвольном meN+ выполняется Г_км(т) = Г_км(2^Г¹^о&^т¹). Получаем

Г_км(т) = 0(т¹^о&³), (27.9)

при этом log₂ 3 = 1,58...

176 Глава 6. Рекуррентные соотношения и сложность алгоритмов

Для m > 1 мы имеем

T_KM(m)>G(m), (27.10)

где функция G натурального аргумента такова, что G(m) = G(2ⁿ°^^m]) для всех m е N⁺ и

G(2^k) =

1, еслиk=0,

3G(2^k^-1), если k >0,

откуда T_км(m) = П(m¹^о&³) по предложению 27.2. Вместе с (27.9) это дает

T_км(m) = в(m¹^о&³). (27.11)

При использовании m, равного максимальной из битовых длин двух данных чисел a, beN+ в качестве размера входа битовая сложность умножения Карацубы допускает оценку

T_км(m) = в(m¹^о&³),

при том, что T_мм = 6(m²) — оценка битовой сложности наивного умножения^г.

Стратегия добавления нулей особенно характерна для исследований, в которых главной целью служит преодоление некоторого слож-ностного барьера; последнее было и остается важным стимулом развития теории сложности.

Пример 27.2.Алгоритм Штрассена умножения двух квадратных числовых матриц A и B порядка n, являющегося степенью двойки, основан на том, что если n = 2l и

A = [A₁₁ A 12Л =(B_U B 12Л

A 21 A₂> B B 21 B₂₂>

где все A_ij,B_ij — квадратные матрицы порядка l, то матрицу

C=AB= CC

можно получить, выполнив семь умножений квадратных матриц порядка l (при том, что потребовалось бы восемь таких умножений при

¹ История создания алгоритма Карацубы и публикации о нем в 1962 г. сообщения [15] увлекательно рассказана в статье [17] самого А. А. Карацубы; особенно богат яркими историческими деталями раздел 6 этой статьи.

§ 27. Добавление нулей

использовании простейшего алгоритма, основанного на определении произведения матриц):

Х_г = (А_и + А₂₂) (В_п + Ваг), *5 = (Ац + А₁₂)В₂₂,
Х₂ = (А₂₁ + А₂₂)В₁_Ъ Х₆ = (А₂₁ - А_п) (В_п + В₁₂),

Х₃ = А_П(В₁₂ -В₂₂), Х₇ = (А₁₂ - А₂₂)(В₂₁ + В₂₂),

Х₄=А₂₂(В₂₁-В_п), далее используются только аддитивные операции:

С_п=Х₁+Х₄-Х₅+Х₇, c₁₂ = x₃+x_s,

с₂₁ = х₂ + х₄, с₂₂ = х₁ + х₃-х₂ + х₆.

В правильности этого можно убедиться прямой проверкой.

Равенство п = 2^к создает возможность для рекурсивного применения алгоритма. Алгоритм Штрассена будем обозначать начальными буквами St фамилии его автора.

В приведенных формулах использовано восемнадцать сложений матриц порядка Z. Сложение двух матриц порядка Z требует I² сложений чисел. В предположении, что n = 2^fc,fceN, имеем для общего числа операций—сложений и умножений чисел:

1, если п = 1,

Г_а(п) =

ГпЛ ГпЛ² (27.12)

7r_St(JJ+18(Jj , еслип>1.

Если п е N+ произвольно, то вначале к матрицам А и В добавляются нулевые строки и столбцы (см. (27.2)) так, чтобы порядки матриц стали равными 2^Г¹^о^&^п¹, а затем применяется описанный рекурсивный алгоритм. Рассматривая равенство (27.12) как систему двух неравенств со знаками ^ и ^ и применяя теоремы 27.1 и 27.2, получаем следующий результат.

Сложность Г_а(п) по числу арифметических операций алгоритма Штрассена перемножения двух числовых матриц порядка п допускает оценку r_st(n) = e(n^l0&⁷), в то время как алгоритм, непосредственно следующий из определения произведения матриц, имеет сложность в(п³) (при этом log₂ 7 = 2,81...).

Что касается булевых матриц, то алгоритм Штрассена не может быть непосредственно применен для их умножения по той, например, причине, что этим алгоритмом используется вычитание, для которого нет аналога в булевой арифметике. Но матрицы А и В порядка п, состоящие из нулей и единиц, можно перемножить как

178 Глава 6. Рекуррентные соотношения и сложность алгоритмов

O(n¹^о&⁷),-смысл

целочисленные. Каждый элемент такого произведения не превосходит n, он равен нулю, если и только если соответствующий элемент произведения булевых матриц равен нулю. Для того, чтобы в процессе применения алгоритма Штрассена к целочисленным матрицам не возникало больших промежуточных значений, здесь можно все вычисления проводить по модулю n + 1, т. е. проводить вычисления не в кольце Z, а в кольце Z_n₊₁. Если M{n)—некоторая верхняя граница для числа битовых операций, затрачиваемых при выполнении одной операции сложения, вычитания или умножения в Z_n₊₁, то сложность модифицированного таким способом алгоритма Штрассена будет допускать оценку O{n^ъ^⁷M{n)). Наивное умножение в Z_n₊₁ дает M(n) = O(log² n). Таким образом, M{n) растет очень медленно в сравнении с остальными затратами. Так как log₂ 7 = 2,81..., мы можем использовать для сложности алгоритма Штрассена, модифицированного на булев случай, например, оценку O(n²'⁸²) или оценку O(n¹^о&⁷), —смысл «O мягкого» объяснялся в конце § 22.

Применение алгоритма Штрассена и арифметики по модулю n + 1 дает алгоритм умножения двух булевых матриц порядка n, битовая сложность которого допускает оценки O{n^ъ^⁷) и O(n²'⁸²).

Мы ограничились рассмотрением применения стратегии «разделяй и властвуй» для случая, когда в результате этапа разделения возникают две задачи, и каждый из размеров входа примерно вдвое меньше изначального размера. Иногда разделение приводит к трем и более задачам.

В 1963 г. А.Л.Тоом обобщил идею умножения Карацубы¹. Пусть s — большее единицы целое. Предполагая, что битовая длина m каждого из сомножителей имеет вид s^k, k е N, последовательность двоичных цифр каждого из сомножителей можно разбить на s групп по s^k^-1 цифр. Тоом показал, что умножение исходных чисел сводится к 2s - 1 умножениям чисел битовой длины s^k^-1 (в умножении Карацубы s = 2, 2s - 1 = 3), остальные затраты—сложения, сдвиги—будут ограничены функцией cm, где c — зависящая от выбора s константа. Здесь этап разделения приводит к 2s - 1 задачам. Для умножения То-ома (TM) неравенство

1, если m = 1, (2s - 1)T^ ( — ) + cm, если m > 1,

T^(m)^ _sГmЛ (²⁷.¹³)

См. [36], [4].

§ 27. Добавление нулей 179

выполненное в случае m = s^k, fceN, и равенство

r«(m) = rW(s'l⁰&ml)_J

выполненное при произвольном meN⁺, приводят к оценке Т^(т) = = 0(m^logs(2s-^i:)) для битовой сложности алгоритма, использующего разбиение на s частей. Может быть также показано, что

r^(s)(m) = e(m^log»^(2s-¹⁾). (27.14)

Очевидно,

log_s(2s - 1) = log_s 2s(l - ^) = 1 + log_s 2 + log_s(l - ^) •

Отсюда

limlog,(2s-l) = l.

Это означает, что для любого е > О можно найти целое s ^ 2 такое, что умножение Тоома с разделением на s частей (битовая длина числа предполагается равной s^k, fceN) будет иметь битовую сложность, допускающую оценку 6(т¹⁺⁵) при некотором 5 таком, что 0 < 5 ^ е; разумеется, для битовой сложности этого алгоритма справедлива оценка 0(.т¹⁺П.

Скажем коротко об основной идее алгоритма Тоома, приводящей к неравенству (27.13). Если, как предполагалось, битовая длина каждого из сомножителей а,Ъ есть s^k, fceN, то последовательность двоичных цифр каждого из сомножителей а, Ъ можно разбить на s групп по s^-1 цифр:

а₃-ъ ■■■> ai> ^ао> b_s-₁, ...,Ь_г,Ъ₀. Сами сомножители а, Ъ суть значения полиномов

А(х) = а_-х"-¹ + ...+_а1х + а₀, В(х) = Ь_-х*^-1 + ... + Ъ_гх + Ъ₀

в точке х₀ = 2^s*^-1. Полином С(х), равный произведению А(х)В(х), есть полином степени не выше чем 2s - 2 (мы не утверждаем, что эта степень равна 2s - 2, так как возможно, что к изначально заданным целочисленным сомножителям спереди дописывались нули), и достаточно знать значения С (х) в 2s- 1 точках (узлах интерполяции) для того, чтобы затем, например, с помощью интерполяционной формулы Лагранжа найти значение

СС2**-¹), (27.15)

180 Глава 6. Рекуррентные соотношения и сложность алгоритмов

равное ab. Тоом показал, что если в качестве узлов интерполяции x_ъ x₂,..., x_2s-i взять числа

-(s-l),-(s-2),...,-l,0,1, ...,s-2,s-l,

рекурсивно с помощью рассматриваемого алгоритма найти

A(x_i\ B{xi), C{x_i)=A{x_i)B{x_i), i = l,2,...,2s-l,

и затем, пользуясь интерполяционной формулой Лагранжа, найти значение (27.15), то это приведет к (27.13), (27.14). Такое использование интерполяции заключает в себе требуемое обобщение алгоритма Карацубы.

В 1972 г. Шенхаге и Штрассен, основываясь на идее Тоома использования интерполяции полиномов в алгоритмах умножения целых чисел, получили алгоритм умножения, битовая сложность которого допускает оценку O{m log m log log m), мы уже упоминали этот алгоритм в §21. Функция m log m log log m растет медленнее, чем m¹⁺⁵при любом 5 > 0. Улучшение достигнуто за счет привлечения интерполяции специального вида — так называемого быстрого преобразования Фурье^г. До настоящего времени результат Шенхаге—Штрассе-на остается рекордным. Шенхаге на основе этого алгоритма умножения предложил алгоритм² нахождения нод(a₀,a_г), сложность которого допускает оценку O{m log² m log log m), где m — битовая длина большего числа a₀ (в примере 21.2 было показано, что алгоритм Евклида имеет сложность Θ(m²)).

Необходимо сказать, что преимущества по времени выполнения рассмотренных алгоритмов перед наивным умножением и алгоритмом Евклида проявляются лишь при очень больших значениях m.

С умножением матриц положение таково, что обобщения алгоритма Штрассена в духе обобщения, предложенного Тоомом для алгоритма Карацубы, до сих пор не найдено. Используя другие идеи, Д. Коп-персмит и С. Виноград в 1987 г. предложили алгоритм со сложностью O(n^2,376), где n—порядок перемножаемых квадратных матриц³. Этот результат остается рекордным по сей день. Существует ли для любого s > 0 алгоритм умножения матриц со сложностью O{n²⁺^е)—это открытый вопрос.

Об алгоритме Шенхаге—Штрассена см., например, [5, разд. 7.5]. См., например, [5, разд. 8.10]. См. [47].

Задачи

5rik.ru

Материалы для учебы и работы

А ОЛ (В ОЛ (АВ О