ГЛАВА 4. ТЕОРИЯ ЧАСТОТЫ МИЗЕСА-РЕЙХЕНБАХА.

Частотная интерпретация вероятности в форме, отличающейся от интерпретации, данной в предшествующей главе, была развита в двух имеющих большое значение книгах германских профессоров, которые жили тогда в Константинополе.

Труд Рейхенбаха является развитием труда Мизеса и в различных отношениях лучшей формулировкой той же самой теории. Я поэтому ограничусь рассмотрением теории Рейхенбаха.

Изложив аксиомы исчисления вероятности, Рейхенбах предлагает далее интерпретацию, которая, по-видимому, внушена статистическими корреляциями. Он исходит из допущения двух последовательностей (x1, х2, ... , xn...), (y1, y2, .... Уn...) и двух классов О и p. Некоторые или все х принадлежат к классу O; его интересует вопрос: как часто соответствующие у принадлежат к классу P?

Допустим, например, что вы исследуете вопрос, предрасположен ли мужчина к самоубийству вследствие того, что он имеет сварливую жену. В этом случае x обозначает жен, а у - мужей, класс О состоит из сварливых женщин, а класс p — из самоубийц. Тогда при том, что жена принадлежит к классу О, наш вопрос заключается в следующем: как часто ее муж принадлежит к классу p?

Рассмотрим отрезки двух последовательностей, состоящие из первых n членов каждой последовательности. Допустим, что среди первых n членов х имеется a членов, принадлежащих к классу О, и допустим, что из них имеется b членов, таких, что соответствуют у и принадлежат к классу p; соответствующий у есть член с тем же самым индексом. Тогда мы говорим, что во всем отрезке от х1 до Xn "относительная частота" О и P есть b/а. Если все х принадлежат к классу О, то а=n и относительная частота есть b/n. Обозначим эту относительную частоту выражением "Hn (О, p)".

Теперь перейдем к определению "вероятности p при данном О", которую мы обозначим как "W(0, p)". Определение следующее: W (О, p) есть предел Нn(0, p), по мере того как n неограниченно увеличивается.

Это определение может быть значительно упрощено с помощью небольшого использования математической логики. Во-первых, нет необходимости иметь две последовательности, так как предполагается, что обе являются рядами (progressions) и имеется, следовательно, взаимно-однозначное соответствие их членов. Если это соответствие есть S, то сказать, что определенный член у принадлежит к классу p, равнозначно тому, что сказать, что соответствующий х принадлежит к классу членов, имеющих отношение S к тому или другому из членов P. Например, пусть S есть отношение жены к мужу, тогда если у есть женатый мужчина, ax — его жена, то утверждение, что у есть правительственный чиновник, является истинным, и только в том случае, если х есть жена правительственного чиновника.

Во-вторых, нет никакого преимущества в принятии случая, в котором не все х принадлежат к классу О. Определение применимо только в том случае, если бесконечное число членов х принадлежит к классу О, в этом случае те х, которые принадлежат к О, образуют ряд, а остальные могут быть отброшены. Таким образом, мы удержим все существенное в определении Рейхенбаха, если подставим следующее.

Пусть О будет рядом, а a каким-либо классом, из числа членов которого в важных случаях имеются члены, которые в последовательности О являются последующими за любым данным членом. Пусть m будет число членов а среди первых n членов О. Тогда W(О, а) определяется как предел m/n, когда n неограниченно возрастает.

Возможно, по недосмотру Рейхенбах говорит, как если бы понятие вероятности было применимо только к бесконечным рядам и не было применимо к конечным класса. Я не могу думать, что он имел это в виду. Человеческая раса, например, есть конечный класс, и мы хотим применить вероятность к статистике жизни, что было бы невозможно согласно букве определения. Психологически, когда Рейхенбах говорит о пределе для n-бесконечности, он думает о предел как некотором числе, к которому легко приблизиться всякий раз, когда n с эмпирической точки зрения является большим, то есть когда оно недалеко от того максимума, который наши средства наблюдения позволяют нам достичь. У него есть аксиома или постулат о том, что, когда есть такое число для каждого большого доступного наблюдению n, оно приблизительно равно пределу для n-бесконечности. Это нелепая аксиома не только потому, что она произвольна, но и потому, что большинство рядов, с которыми нам приходится иметь дело вне чистой математики не являются бесконечными; в самом деле, можно сомневаться, являются ли таковыми какие-либо из них. Мы привыкли считать пространство-время непрерывным, что предполагает существование бесконечных рядов; но это предположение не имеет иного основания, кроме математического удобства.

Для того чтобы сделать теорию Рейхенбаха насколько возможно более адекватной, я буду исходить из того, что там, где речь идет о конечных классах, должно быть сохранено определение, данное в предшествующей главе, и что новое определение имеет целью только расширение, позволяющее нам применять вероятность к бесконечным классам. Таким образом, его Нn(0, p) будет вероятностью, но приложимой только к первым n членам ряда.

То, что Рейхенбах постулирует в качестве своей формы индукции, есть нечто вроде следующего. Допустим, что мы сделали N наблюдений в отношении корреляции О и p, так что мы в состоянии вычислить Нn (О, p) для всех значений n до n=N, и допустим, что во всей последней половине значений n вероятность Hn(О, p) всегда отличается от определенной дроби p меньше, чем на е, где e — мало. Тогда мы утверждаем, что, сколько бы мы ни увеличивали n, вероятность Нn(0, p) будет все-таки находиться в этих узких границах, и, следовательно, W (О, p), являющееся пределом для n-бесконечности, будет также лежать в этих границах. Без этого допущения мы не можем иметь эмпирического свидетельства в отношении предела для n-бесконечности, и вероятности, для которых, определение специально предназначено, должны оставаться неизвестными.

В защиту теории Рейхенбаха перед лицом вышеупомянутых затруднений можно высказать два соображения. Во-первых, он может утверждать, что нет необходимости предполагать, что n беспредельно стремится к бесконечности; для всех практических целей достаточно, если n будет очень большим. Допустим, например, что мы занимаемся статистикой жизни. Для страховой компании не имеет значения, что произойдет со статистикой, если она будет продолжена на следующие десять тысяч лет; ее могут касаться самое большее следующие сто лет. Если, собрав статистические данные, мы предполагаем, что частоты останутся приблизительно теми же самыми даже тогда, когда мы соберем в десять раз больше данных, чем мы собрали, то этого будет достаточно почти для всех практических целей. Рейхенбах может сказать, что, когда он говорит о бесконечности, он пользуется удобной математической стенографией, имея в виду только "гораздо больше, чем мы до сих пор исследовали". Он может сказать, что этот случай совершенно аналогичен случаю эмпирического определения скорости. Теоретически скорость может быть определена только, если нет предела малости измеряемых отрезков пространства и времени; в практике, поскольку такой предел имеется, мгновенная скорость никогда не может быть известна даже приблизительно. Правда, мы можем узнать с достаточно большой точностью среднюю скорость на протяжении короткого промежутка времени. Но даже если мы предположим постулат непрерывности, средняя скорость на протяжении, скажем, секунды не дает абсолютно никакого указания на мгновенную скорость в данный момент в интервале этой секунды. Все движение может состоять из периодов покоя, разделенных моментами бесконечно большой скорости. Но даже и помимо этой крайней гипотезы и даже если мы допустим непрерывность в математическом смысле, любая конечная мгновенная скорость несовместима с какой-либо конечной средней скоростью на протяжении конечного интервала времени — как бы он короток ни был, — содержащего этот момент. Для практических целей, однако, это не имеет значения. За исключением таких немногих явлений, как взрывы, если мы принимаем мгновенную скорость в любой момент на протяжении очень короткого измеримого интервала времени как приблизительно среднюю скорость в течение этого интервала, то законы физики оправдываются. "Мгновенная скорость" поэтому может рассматриваться не иначе, как удобная математическая фикция.

Подобным же образом Рейхенбах может сказать, когда он говорит о пределе частоты, когда n бесконечно, что он имеет в виду только актуальную частоту для очень больших чисел, или, скорее, эту частоту с небольшим запасом ошибки. Бесконечное и бесконечно малое одинаково ненаблюдаем и, следовательно (как он может сказать), одинаково не имеют значения для эмпирического знания.

Я склонен признать справедливость этого ответа. Я только сожалею, что это не выражено явно в книге Рейхенбаха; я думаю тем не менее, что он должен был это иметь в виду.

Второе соображение в пользу его теории — то, что она применима как раз к тем случаям, в которых мы хотим воспользоваться аргументами вероятности. Мы испытываем желание воспользоваться этими аргументами, когда имеем некоторые данные, касающиеся определенного будущего события, но которых недостаточно, чтобы определить его характер в некотором интересующем нас отношении. Моя смерть, например, является событием будущего, и если я страхую свою жизнь, то я могу испытывать желание узнать, какое существует свидетельство, касающееся вероятности его осуществления в том или ином данном году. В таком случае мы всегда имеем некоторое число индивидуальных фактов, записанных в виде последовательности, и предполагаем, что частоты, обнаруженные до сих пор, будут более или менее продолжать оставаться такими же. Или возьмем азартную игру, в которой и возник весь этот вопрос. Мы не интересуемся тем простым фактом, что имеется 36 возможных результатов бросаний с двумя костями. Мы интересуемся тем фактом (если это факт), что на протяжении длинной последовательности бросаний каждая из 36 возможностей будет осуществляться приблизительно одинаковое число раз. Этот факт не вытекает из одного лишь существования 36 возможностей. Когда вы встречаете незнакомого человека, есть только две возможности: одна та, что его зовут Эбинизер Уилкс Смит, другая — что его зовут не так. Но на протяжении долгой жизни, в течение которой я встретил множество незнакомых людей, я только один раз столкнулся с реализацией первой возможности. Чисто математическая теория, которая только перечисляет возможные случаи, лишена практического интереса, если мы не знаем, что каждый возможный случай осуществляется приблизительно с одинаковой или с какой-то известной частотой. А это, если мы рассматриваем не логическую схему, а события, может быть известным только через действительную статистику, использование которой — как я сказал бы — должно идти более или менее в соответствии с теорией Рейхенбаха.

И этот аргумент я принимаю предварительно; он будет исследован заново, когда мы придем к рассмотрению индукции.

Есть совершенно другого рода возражение против теории Рейхенбаха в его собственной формулировке, и это возражение относится к ее введению последовательностей там, где, по-видимому, только классы логически значимы. Возьмем пример: каков шанс, что выбранное наудачу целое число окажется простым? Если мы возьмем целые числа в порядке их следования в натуральном ряде, то шанс, в соответствии с его определением, равен нулю; так как если n есть целое число, то число простых чисел, меньших или равных n, есть приблизительно n /(In n), если n — большое, так что шанс, что целое число, меньшее, чем n, будет простым числом, стремится к n /(In n), а предел 1/(1п n), поскольку n безгранично увеличивается, равен нулю. Но теперь допустим, что мы расставим целые числа в следующем порядке: поставим сначала первые 9 простых чисел, затем первое число, не являющееся простым, затем 9 простых, а затем второе число, не являющееся простым, и так далее до бесконечности. Когда целые числа расставлены в этом порядке, определение Рейхенбаха показывает, что шанс того, что выбранное наудачу число будет простым, равен 9/10. Мы могли бы даже расставить целые числа так, чтобы шанс того, что выбранное число не будет простым, стал равен нулю. Чтобы получить этот результат, начнем с первого непростого числа, то есть с 4, и поставим после n-го числа, не являющегося простым, n простых чисел, следующих после уже поставленных; эта последовательность начинается следующим образом: 4, 1, 6, 2, 3, 8, 5, 7, 11, 9, 13, 17, 19, 23, 10, 29, 31, 37, 41, 43, 12... В этой расстановке перед (n +1)-м непростым будет n непростых и 1/2n (n +1) простых; таким образом, по мере того как n возрастает, отношение числа непростых к числу простых приближается к 0 как пределу.

Из этого примера ясно, что если принять определение Рейхенбаха, то при данном любом классе А, имеющем столько же членов, сколько есть натуральных чисел, и при данном любом бесконечном подклассе В шанс, что выбранное наудачу А будет В, равен любому числу между 0 и 1 (включая и то и другое) в соответствии со способом, который мы избираем для распределения членов В среди А.

Из этого следует, что если вероятность должна применяться к бесконечным совокупностям, она должна применяться не к классам, а к последовательностям. Это кажется странным.

Правда, там, где в деле участвуют эмпирические данные, они все даются во временном порядке и, следовательно, в виде последовательности. Если мы избираем предположение о возможности бесконечного числа событий исследуемого нами вида, тогда мы можем также заключить, что наше определение вероятности является применимым только до тех пор, пока события располагаются во временной последовательности. Но вне чистой математики ни одна последовательность нам неизвестна как бесконечная, а большинство, насколько мы можем судить, является конечными. Каков шанс, что человек шестидесятилетнего возраста умрет от рака? Конечно, мы можем определить этот шанс и без допущения, что число людей, которые до конца мира умрут от рака, бесконечно. Но, согласно букве определения Рейхенбаха, определить это было бы невозможно.

Если вероятности зависят от того, что события берутся в их временном, а не в каком-либо другом порядке, в каком их можно расположить, то вероятность не может быть ветвью логики, а должна быть частью изучения природы. Взгляд Рейхенбаха не таков; он считает, напротив, что всякая истинная логика есть логика вероятности и что классическая логика ошибочна, потому что она делит предложения по признаку их истинности или ложности, а не по признаку обладания той или иной степенью вероятности. Он должен был бы поэтому сформулировать основные положения теории вероятности в абстрактных логических терминах, не вводя в них такие случайные признаки действительного мира, как время.

Имеется очень большая трудность в соединении статистического взгляда на вероятность со взглядом, которого также придерживается Рейхенбах и который состоит в том, что все предложения обладают только различными степенями вероятности, не достигающими достоверности. Трудность заключается в том, что тем самым мы, по-видимому, осуждены на бесконечный регресс. Допустим, что мы говорим о вероятности того, что человек, заболевший чумой, умрет от нее. Это значит, что если бы мы могли составить полную последовательность людей, которые с древнейших времен и до исчезновения человеческой расы болели и будут болеть чумой, то мы установили бы, что больше половины из них умерли и умрут от нее. Поскольку в отношении будущего и значительной части прошедшего регистрации нет, постольку мы считаем, что зарегистрированные случаи служат хорошим образчиком. Но теперь мы должны вспомнить, что все наше знание только вероятно; следовательно, если, собрав наши статистические данные, мы найдем, что А болел чумой и умер от нее, то мы должны рассматривать этот случай не как достоверный, а только как вероятный. Чтобы узнать, насколько он вероятен, мы должны включить его в последовательность, скажем, официальную регистрацию смертей, и должны найти какой-либо способ удостовериться, какое отношение регистрации смертей является правильным. При этом какой-нибудь отдельный пункт в нашей статистике окажется, например, следующим: "Было официально удостоверено, что мистер Браун умер, но потом оказалось, что он все же живой". Но и этот пункт в свою очередь должен быть только вероятным и должен, следовательно, входить в последовательность зарегистрированных официальных ошибок, некоторые из которых окажутся не ошибками. Это значит, что мы должны собрать случаи, когда мы ошибочно верили, что лицо, зарегистрированное как умершее, оказалось все-таки живым. Этому процессу не может быть конца, если все наше знание только вероятно, а вероятность имеет только статистический характер. Если мы хотим избежать бесконечного регресса, а все наше знание является только вероятным, то "вероятность" должна интерпретироваться как "степень правдоподобия" и должна определяться не статистически, а как-либо иначе. Статистическая вероятность может определяться только на основе действительной или постулируемой достоверности.

Я вернусь в Рейхенбаху в связи с индукцией. А сейчас я хочу разъяснить мой собственный взгляд в отношении связи математической вероятности с естественным ходом вещей в природе. Возьмем в качестве примера закон больших чисел Бернулли, выбрав самый простой из возможных случаев. Мы видели, что если мы соберем все возможные целые числа, состоящие из n знаков, каждое из которых будет или 1, или 2, то, если n является большим — скажем, не меньшим, чем 1000,— огромное большинство возможных целых чисел будет иметь приблизительно одинаковое число единиц и двоек. Это есть только применение того факта, что при разложении бинома (х + у)n, когда n — большое, сумма биноминальных коэффициентов около середины будет мало отличаться от суммы всех коэффициентов, каковая равна 2n. Но какое это имеет отношение к утверждению, что если я буду достаточно много раз бросать монету, то я, вероятно, получу приблизительно одинаковое число выпадений лицевой и оборотной сторон? Первое есть логический факт, второе, очевидно, является эмпирическим фактом; какова же связь между ними?

При некоторых интерпретациях "вероятности" утверждение, содержащее слово "вероятный", никогда не может быть эмпирическим утверждением. Признается, что то, что не является вероятным, может произойти, а то, что считается вероятным, может не произойти. Из этого следует, что то, что на самом деле происходит, не показывает, что прежнее суждение о вероятности было или правильным, или ложным; любой воображаемый ход событий логически совместим с любой предшествующей оценкой вероятности, какую только можно вообразить. Это можно отрицать только в том случае, если мы будем считать, что то, что в высокой степени невероятно, не происходит, чего мы не имеем права думать. В частности, если индукция утверждает только вероятности, тогда все то, что может произойти, логически совместимо как с истинностью, так и с ложностью индукции. Следовательно, индуктивный принцип не имеет эмпирического содержания. Это есть reductio ad absurdum и показывает, что мы должны связывать вероятное с действительным теснее, чем это иногда делается.

Если мы согласимся с теорией конечной частоты — а я пока не вижу оснований не соглашаться с ней,— то скажем, что, утверждая вероятность суждения "о есть А "при том, что "а есть B", мы имеем в виду, что действительно большинство членов B является членами А Это есть утверждение факта, а не утверждение об a. И если я скажу, что индуктивный аргумент (соответствующим образом сформулированный и ограниченный) делает заключение из него вероятным, то я имею в виду, что он является одним из класса аргументов, из большинства которых вытекают истинные заключения.

Что теперь могу я иметь в виду, когда говорю, что шанс выпадения лицевой стороны монеты равен половине? Начнем с того, что это, если оно истинно, является эмпирическим фактом; это не следует из того факта, что в бросании монеты есть только две возможности: выпадение лицевой и оборотной сторон. Если бы это следовало из него, мы могли бы сделать вывод, что шанс того, что какой-либо незнакомец называется Эбинизер Уилкс Смит, равен половине, поскольку здесь есть только две возможности, именно что он или называется, или не называется так. В некоторых монетах лицевая сторона выпадает чаще, чем оборотная; в других оборотная чаще, чем лицевая. Когда я говорю, не конкретизируя монету, что шанс выпадения лицевой стороны равен половине, то что я имею в виду?

Мое утверждение, как и все другие эмпирические утверждения, претендующие на численную точность, будет только приблизительным. Когда я говорю, что рост человека равен 6 футам 1 дюйму, мне разрешается до определенных пределов допускать ошибку; даже если бы я поклялся, что у меня нет ошибки, то все равно меня нельзя было бы обвинить в том, что я клятвопреступник, если даже окажется, что я ошибаюсь на одну сотую дюйма. Точно так же нельзя считать, что я высказал ложное утверждение о моменте, если окажется, что 0,500001 будет более точной оценкой, чем 0,5. Однако сомнительно, сможет ли какое бы то ни было свидетельство заставить меня думать, что 0,500001 является лучшей оценкой, чем 0,5. В теории вероятности, как и всюду, мы берем наиболее простое предположение, приблизительно соответствующее фактам. Возьмем, скажем, закон падения тел. Галилей сделал некоторое количество наблюдений, которые более или менее соответствовали формуле s = 1/2 gt2. Без сомнения, он мог бы найти такую функцию f(t), что s = f(t) соответствовала бы его наблюдениям более точно, но он предпочел простую формулу с достаточно хорошим соответствием. Точно так же, если я бросил монету 2000 раз и получил 999 выпадений лицевой стороны и 1001 оборотной стороны, я должен считать шанс выпадения лицевой стороны равным половине. Но что именно должен я иметь в виду, утверждая это?

Этот вопрос показывает силу определения Рейхенбаха. Согласно ему, я имею в виду, что если я буду продолжать бросать достаточно долго, то пропорция выпадений лицевой стороны со временем будет постоянно очень близкой к 1/2; действительно, она будет отличаться от 1/2 на величину, меньшую, чем сколь угодно малая дробь. Это предсказание; если оно правильно, то моя оценка вероятности верна, если же неправильно, то она будет неверной. Что может теория конечной частоты противопоставить этому?

Мы должны различать между тем, что есть вероятность, и тем, что она вероятно есть. Что касается того, что вероятность есть, то это зависит от класса рассматриваемых нами бросаний. Если мы рассматриваем бросание с данной монетой, тогда, если за все время своего существования эта монета даст m выпадений лицевой стороны из общего числа A бросаний, вероятность выпадения лицевой стороны у этой монеты будет m/n. Если же мы рассматриваем монеты вообще, то n должно быть общим числом бросаний всех монет, какие только существовали и будут существовать на протяжении всей прошедшей и будущей истории мира, а m — числом всех выпадений лицевой стороны. Чтобы сделать вопрос менее обширным, мы можем ограничиться бросаниями, имевшими место в этом году в Англии, или бросаниями, попавшими в таблицы исследований вероятности. Во всех этих случаях m и n — конечные числа, а m/n есть вероятность выпадении лицевой стороны при данных условиях.

Но ни одна из приведенных выше вероятностей не известна. Мы поэтому вынуждены оценить их, то есть найти какой-либо способ решить, что они вероятно представляют собой. Если мы присоединяемся к теории конечной частоты, то это значит, что наша последовательность выпадений лицевой и оборотной сторон должна быть членом какого-то ограниченного класса последовательности и что мы должны иметь какое-то относящееся к делу знание обо всем этом классе. Предположим, что мы наблюдали, что в каждой последовательности из 10000 или более бросаний данной монеты отношение выпадений лицевой стороны после 5000-го бросания никогда не изменялось более чем на 2е, где е — очень мало. Мы можем тогда сказать: в каждом наблюдаемом случае отношение выпадений лицевой стороны после 5000 бросков данной монеты всегда оставалось между p — е и p + s, где p есть постоянная, зависящая от монеты. Аргументировать, исходя из этого, к случаю, еще не наблюденному, есть дело индукции. Для того чтобы это заключение было действительным, мы нуждаемся в аксиоме о том, что (при определенных обстоятельствах) признак, присутствующий во всех наблюденных случаях, присутствует в большом отношении всех случаев;

или во всяком случае нам нужна какая-либо аксиома, из которой вытекала бы эта. Тогда мы сможем выводить из наблюденных частот вероятную вероятность, интерпретируя вероятность в согласии с теорией конечной частоты.

Вышеизложенное является только набросками теории. Главное, что я хочу подчеркнуть, есть то, что по теории, которую я защищаю, всякое утверждение вероятности (в противоположность только сомнительному утверждению) есть утверждение факта, касающегося какого-либо отношения в последовательности. В частности, индуктивный принцип — все равно, истинный или ложный — должен утверждать, что как факт большинство последовательностей определенного вида имеет повсюду любой признак определенного рода, который имеется у большого числа следующих друг за другом членов последовательностей. Если это факт, то индуктивные аргументы могут давать вероятность; если же это не так, то не могут. Сейчас я не исследую, каким образом, мы можем знать, является ли это фактом или нет; эту проблему я не буду рассматривать до последней части нашего исследования.

Из сказанного можно видеть, что в результате вышеприведенного обсуждения мы пришли к согласию с Рейхенбахом по многим пунктам, хотя определенно не согласны с ним в отношении определения вероятности. Главное мое возражение против его определения —то, что частота, от которой оно зависит, гипотетична и не поддается удостоверению. Я не согласен с ним также и а том, что более резко по сравнению с ним различаю вероятность и сомнительность, и в том, что считаю, что логика вероятности с логической точки зрения не является основной в противоположность логике достоверности.

5rik.ru

Материалы для учебы и работы

ГЛАВА 4. ТЕОРИЯ ЧАСТОТЫ МИЗЕСА-РЕЙХЕНБАХА.