Л. И. Сантылова миф, математика и филология лекции
Вид материала | Лекции |
- Программа элективного курса по литературе для обучающихся в 11 классе «Литература античного, 174.51kb.
- Календарно-тематическое планирование в 9 классе по курсу «русско-мордовский фольклор», 48.55kb.
- Учебное пособие для студентов специальностей 050205-Филология: русская филология, 050210-Филология:, 1158.83kb.
- Учебная программа для высших учебных заведений по специальностям: 1-21 05 01 Белорусская, 291kb.
- Ролан Барт. Миф сегодня, 924.93kb.
- План Понятие мифа и мифологии. Черты и типология мифов. Миф и его роль в культуре Миф, 92.21kb.
- 1. Почему миф называют мифом. Чем миф отличается от сказки, 172.73kb.
- Программа для вступительных экзаменов в магистратуру по специальности 6М020500 Филология, 312.86kb.
- Конкурс и проходной балл встурительной кампании 2011 года, 133.06kb.
- Гений русского Просвещения: библиографический список литературы, 171.21kb.
«Рыжая корова сильно толкнула козла и гоняет козлёнка»
или
«Молодая студентка щедро одарила парнишку и ласкает ребёнка»
и т.д.
Рассмотрим простейший экономический пример. Пусть цена товара каждый год снижается на 10% (благородная фирма!). Какова будет цена через 10 лет?
Типичный (и, разумеется, неправильный) ответ – 0 рублей!
Правильный ответ (0.9)10 начальной цены, то есть около 35% !
В общих, буквенных обозначениях, если доля уменьшения цены в год - q, то связь между начальной ценой c0 и ценой cn через n лет такова:
c n = c0 (1-q)n
По этой формуле легко считать изменение цены для любого уменьшения цены, а также ответить на вопрос; через сколько лет цена уменьшится в m раз?
c n / c0 = (1-q)n 1/m или n - ln m/ ln (1-q)
Хотя основные элементы математических рассуждений, формальной логики были заложены Аристотелем, их формализация введена в ХУ111 –Х1Х веках и составила предмет «математической логики». Её основные элементы (алфавит): понятие «истинности» (true) и «ложности» (false), а также «кванторы» (значки) «всеобщности» и «существования» .
Их перевод очевиден («всегда имеет место» и «существует»). А придание им цифровых значений и введение обозначений для основных операций (И, ИЛИ, НЕТ или and, or, not) позволяет превратить логические рассуждения в своеобразное исчисление, формализовать и передать логику компьютерам.
Подобно обычным, естественным языкам эти формальные правила «исчисления высказываний» играют роль грамматики такого специального языка. Эти правила определяются АКСИОМАМИ, некоторыми простейшими исходными положениями, принимаемыми без доказательства и основанными на некоторых априорных свойствах изучаемых явлений. Такой аксиоматический подход – постулирование некоторых минимальных свойств и формальное изучение всех возможных следствий из них, ТЕОРЕМ, - характерен для современной математики. Хотя он до некоторой степени схоластичен, является наследием средневекового стиля. Но он чётко выделяет область изучаемых явлений, её упрощённое представление, которое позволяет выяснить те менее очевидные свойства, которые являются следствием принятых аксиом.
Легко привести примеры аксиом, как в математике, так и в филологии:
Для любого числа найдётся число, большее, чем данное.
Любое явление может быть описано разными текстами.
Некоторые аксиомы пытаются доказать, обосновать - и они превращаются в теоремы. Или – порождают разные классы наук.
При этом возникает необходимость анализа системы аксиом, отбор их минимального набора. Для формальной логики таким минимальным набором и правилами «правильных» заключений является «теория силлогизмов», предложенная ещё Аристотелем и развитая позднейшими исследователями.
Примеры?
Теоремы представляют собой концентрированные выводы из аксиом, полученные в рамках рассматриваемой системы моделей, помогающие вести дальнейшие рассуждения, не обращаясь к простейшим положениям, а опираясь на эти обобщённые «ступеньки». Многие теоремы не дают прямого пути к решению поставленной задачи, а лишь утверждают существование этого решения. Поскольку всякая сложная задача представляет собой «поиск чёрной кошки в чёрной комнате», теорема играет роль утверждения, что кошка действительно находится в этой комнате, следовательно, можно организовать её поиск. Характерным примером является шутливая «теорема Дирака», утверждающая, что существует оптимальное расстояние, с которого лучше всего рассматривать женское лицо (с меньшего расстояния видны мелкие недостатки, с большего – трудно рассмотреть его достоинства). Но никаких путей определения этого оптимального расстояния теорема не даёт!
При анализе любой задачи исследователю приходится быть полиглотом, переводя эту задачу с одного языка на другой:
- исходное, словесное описание задачи (проблемы);
- её математическая формулировка – система обозначений, связей, условий;
- геометрический смысл задачи, её наглядная интерпретация;
- алгоритм решения – описание процедур, ведущих к решению;
- компьютерная реализация алгоритма и его проверка.
Как уже было отмечено выше, реальные процессы не всегда идут «по Аристотелю», и с интерпретацией формальных выводов нужно быть осторожным. Но аксиоматический подход исключает «различное понимание» тех или иных терминов и понятий, что нередко возникает в гуманитарных науках и является источником напряжённых споров. Однако существует область применения этой формальной системы, где её использование даёт безусловно верные результаты, и чрезвычайно важная для применений – это теория электронных схем, лежащая в основе всех приборов, использующих микроэлектронику – от простейших электронных замков до сложнейших регуляторов, анализаторов и компьютеров.
Поскольку можно кодировать основные логические понятия числами 0 и 1 , основным «внутренним» языком почти всех компьютеров является двоичная система счисления («арифметика гуингмов» - «мыслящих лошадей» из романа Дж. Свифта)2. Примеры?
Двоичная система счисления обладает неоценимым техническим преимуществом: она позволяет по неточным сигналам (значениям тока) получать точное кодирование – ведь легко отличит наличие сигнала (1) от его отсутствия (0), но гораздо труднее отличить сигнал уровня 7 от сигнала уровня 6 или 8!
Фундаментальную роль в оценке возможностей аксиоматического подхода играет теорема Гёделя, доказанная в 1931 году и утверждающая, что в любой формальной аксиоматической системе есть факты (утверждения), которые в рамках этой системы нельзя ни доказать, ни опровергнуть. То есть обнаружение таких фактов требует обобщения, расширения этой формальной системы, пополнения или изменения аксиом. Тем самым выявляется путь развития математики как способа познания мира: выделение формальной упрощённой системы, её изучение, выявление фактов, недоступных изучению в рамках этой системы, её расширение и обобщение.
Применение формальной логики и аксиоматического метода к геометрии привело к системе аксиом Евклида, но тут же обнаружился пример её неполноты – знаменитый «Пятый постулат» о параллельных линиях, иллюстрирующий ту же теорему Гёделя. Преодоление этой трудности Гауссом, Лобачевским и Больяи привело в 18-19 веках к открытию «неевклидовых» геометрий.
«Математические аксиомы – не всеобщие аксиомы. То, что справедливо в применении к отношениям между формой и количеством, часто оказывается вздором в применении, например, к истинам моральным. В этой области положение: «сумма частей равна целому» – в большинстве случаев оказывается неверным.» (Эдгар По)
Простейшей формальной системой, с которой знакомы мы все, является арифметика – выделяющая понятие числа и правила действий с ними. И на этом примере легко проследить отмеченный выше процесс познания.
Начальная система – арифметика целых чисел, на которых определены операции сложения и умножения. Но уже в этой простейшей системе попытка обращения операций (по сумме и одному из слагаемых определить второе слагаемое, по произведению и одному из сомножителей найти второй сомножитель) заставило человечество довольно давно расширить эту систему: ввести понятия отрицательных и дробных, рациональных чисел. Кстати, это обобщение довольно трудно воспринималось греками и египтянами, и не так уж легко воспринимаются и сейчас школьниками.
Обобщение операции умножения – возведение в степень, an . Введение нецелой степени и обращение этой операции опять таки потребовало расширения системы и её аксиоматики – появились понятия логарифма n=log a, иррационального и трансцендентного чисел.
Приведенные примеры являются основой методологического обобщения:
Процесс развития любой науки, процесс познания, идёт по следующей схеме – построение формальной модели, извлечение из неё всех возможных выводов, обращение и обобщение введённых понятий и операций, построение расширенной, обобщённой модели (спираль познания).
Эта методология важна как для более глубокого познания (осмысления) математики, так и для изучения других наук, в том числе филологии.
Так, при изучении любого языка лингвисты сначала составляют словарь простейших понятий, затем – грамматику, законы изменения слов и связей между ними, а потом – более глубоко изучают процессы происхождения языка, связи с другими языками.
Спираль – движение природы!
Спирально движутся народы.
Спирально носят огороды
Свои сезонные наряды.
Нужны наряды – и снаряды,
Нужны наяды – но и яды…
(Александр Кондратов)
- Функции и операции над ними.
«А ему нужно было произвести математический анализ основных факторов, создающих красоту, выразить их однойвсеохватывающей формулой, такой сжатой, чтобы она объясняла искусство, как гравитационная формула материи охватывает структуру всей Вселенной.»
С.Лем.
Функции , непрерывность и гладкость – Апории Зенона
- Пределы – Решение уравнений и метод итераций
– Дифференциальное исчисление – история , словарь и грамматика
- Применение дифференциального исчисления
- Идентификация зависимостей, МНК – Алгебраизация геометрии, примеры
Следующим за понятием числа и его обобщением, величины – исторически и логически, - понятием математики является понятие функции: результат некоторых действий над одной величиной x, приводящий к значению другой величины f(x), зависимость f от x. Действительность даёт неисчислимое множество таких объектов, зависимостей скорости и пути от времени, требуемой теплоты нагрева от температуры, затрат и прибыли от объёма выпуска продукции и т.п.
Неявно это понятие было освоено уже в древней Греции, но тогда же были обнаружены и некоторые парадоксы – знаменитые апории3 Зенона (догонит ли Ахиллес черепаху, летит ли стрела и др.).
Чаще всего функция задаётся некоторой формулой – комбинацией известных «элементарных» функций, изучаемых в школе. Например,
Y =sin (2x – 1), y = log(2x+1), z = 2x/(x-2).
Простейшей, и очень наглядной формой описания функции является график её – кривая на плоскости, где абсцисса - аргумент, а ордината – значение функции.
Если функция задана некоторым алгоритмом, процессом вычисления, то надо задать порядок действий (вычисления f по x) или достаточно густую таблицу значений f и x. Переход от одной формы задания функции сравнительно лёгок: по формуле или алгоритму можно найти точки графика, переход от графика к формуле несколько сложнее и будет описан дальше. Графики приведенных выше функций изображены на рис. 1,2,3. Рис. 1. График функции Y =sin (2x – 1)
Рис. 2. График функции y = log(2x+1)
Рис. 3. График функции z = 2x/(x-2)
При изучении функций важную роль играют область определения функции (ООФ), то есть совокупность тех значений аргумента, при которых существует эта функция, и область возможных значений функции (ОЗФ). Для приведенных выше примеров они таковы:
ООФ: (- ,+ ) х -1/2 х 2
ОЗФ: -1 Y 1 (- ,+ ) (- ,+ )
Если вычисление значения функции по значению аргумента так или иначе определено заданием функции, то обратная задача (найти значение аргумента, отвечающего заданному значению функции, найти обратную функцию x = (f)) приводит к некоторому уравнению, решение которого далеко не всегда можно сразу выписать. Выше было отмечено это методологическое свойство: обратная задача, как правило, сложнее прямой задачи. Анализ графиков функций при этом играет важную роль, определяя существование и (или) единственность решения рассматриваемого уравнения.
Например, для уравнения x – cx –d = 0 , 0 1 («филологическое происхождение» которого будет пояснено далее) легко убедиться в существовании положительных решений и найти их с любой требуемой точностью методом последовательных приближений. На рисунке 4 изображены графики функций и , когда =0,5; c=0,4; d=0,1. Корни уравнения соответствуют точкам пересечения этих графиков. Очевидно, что уравнение имеет два положительных корня.
Рис.4. Графики функций и (=0,5; c=0,4; d=0,1).
Эти корни можно найти методом итераций. Для определения корня, близкого к нулю, для организации итерационного процесса используем зависимость . Результаты вычислений приведены в таблице 1.
При вычислении большего корня для обеспечения сходимости итерационного процесса используем зависимость . Результаты вычислений приведены в таблице 2.
Найденные значения корней =0,01; =5,73.
Таблица 1
Вычисление корня методом итераций по формуле
Номер итерации | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
Значения Х | 2,000 | 0,810 | 0,180 | 0,030 | 0,013 | 0,011 | 0,011 |
Таблица2
Вычисление корня методом итераций по формуле
Номер итерации | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
Значения Х | 2,000 | 3,286 | 4,282 | 4,923 | 5,297 | 5,504 | 5,615 | 5,674 | 5,705 | 5,721 | 5,730 |
Изучение возможных функций, их графиков и апорий Зенона привели (уже значительно позже) к понятию о непрерывности функции, формализованному с помощью теории пределов, а также вопросов, связанных с изучением динамики изменения величин и функций. Примеры?
Важной характеристикой функции, зависимости f(x) является быстрота, скорость изменения её при изменении аргумента, то есть отношение приращений f/x или его предельная форма (при x 0) f (x), введённая Ньютоном и Лейбницем в конце ХVII века. Правила вычисления производных составляют предмет дифференциального исчисления и, как всякий язык, имеют свою грамматику (общие правила) и словарь (таблицы производных). Эти правила позволяют вычислять производные практически всех обычно встречающихся функций (кроме исключительных случаев, важных для теории, но для практики не существенных). Правила дифференцирования сведены в таблицу 3
Приведенные простейшие соотношения позволяют вычислять производные любых функций, заданных различными выражениями. Например, производная дроби может быть вычислена при помощи производной произведения и т.д. На практике удобнее использовать более развёрнутые грамматические формулы («расширенную грамматику»).
Таблица 3
Грамматика | | Словарь | ||
Функция | Производная | | Функция | Производная |
Cu | Cu | | C | 0 |
u + v | u + v | | x | 1 |
uv | u v + u v | | Sin(x) | Cos(x) |
un | nun-1u | | Cos (x) | - Sin(x) |
ln u | u /u | | Arcsin (x) | |
eu | u eu | | Arcos (x) | - |
F(u) | F (u) u | | Sh (x) | Ch (x) |
Наличие словаря и грамматики позволяет вычислять производные, не обращаясь каждый раз к общему определению и предельному переходу. Это аналогично использованию словаря и грамматики в филологии: нужное слово и правила его изменения смотрим в словаре, а не анализируем его происхождение (хотя такой анализ зачастую даёт дополнительную языковедческую информацию).
Знание производных позволяет применять их для решения важных прикладных задач: отличать рост функции от её убывания, оценивать приближённые значения прироста функций ( f f (x) x), решать уравнения, искать экстремальные значения (максимум и минимум) функции, которые отвечают нулевым значениям производной.
Приведём подробный пример. Пусть анализируется некоторый текст, и эффективность анализа, естественно, растёт с ростом времени анализа х, причём этот рост пропорционален степени затраченного времени в степени :
F1 =c1 x , 0 1.
Если затраты на проведение анализа пропорциональны времени
F2 = c2 x +c3 , c1 ,c2 , c3 - положительные константы, то окончательный эффект анализа определяется разностью этих функций4:
F(x) = F1 – F2 = c1 x - c2 x - c3
Возникает вопрос: сколько же времени нужно анализировать текст, чтобы добиться максимального эффекта?.
Построив графики рассматриваемых функций, убеждаемся (с помощью анализа производных при х = 0 х = ), что окончательный эффект положителен в некотором диапазоне [x1 , x2 ] и достигает максимума в точке x* . Значения x1 , x2 определяются решением уравнения
F(x) = F1 – F2 = c1 x - c2 x - c3 = 0,
а x* уравнением F (x) = c1 x -1 – c2 = 0 , то есть
x*= (c2 / c1 )1/( -1 )
На рисунке 4 изображен график функции F(x) для случая, когда c1 =200, c2=130, c3 = 20, =0,7.
Концы отрезка [x1 , x2 ] нашли, решив уравнение методом итераций. При вычислении x1 очередное значение искомой величины находили по формуле . Результаты приближенных вычислений сведены в таблицу 4.
При вычислении правого конца итерации проводились по формуле . Результаты вычислений смотрите в таблице 5.
При этом с точностью до двух знаков получили x1=0,06, x2=3,66.
При указанных значениях параметров найдено x*=1,28 и F(x*)=51,33.
Таблица 4
Вычисление левого конца диапазона [x1 , x2 ]
Номер итерации | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Значения Х | 2 | 1,617 | 1,223 | 0,853 | 0,546 | 0,324 | 0,188 | 0,117 | 0,084 | 0,069 | 0,063 | 0,061 |
Таблица 5
Вычисление правого конца диапазона [x1 , x2 ]
Номер итерации | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 |
Значения Х | 2 | 2,345 | 2,640 | 2,882 | 3,073 | 3,222 | 3,336 | 3,422 | 3,486 | 3,533 | 3,569 | 3,594 |
Номер итерации | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 |
Значения Х | 3,613 | 3,627 | 3,638 | 3,645 | 3,650 | 3,654 | 3,657 | 3,659 | 3,661 | 3,662 | 3,663 | |
Рис 5. График функции F(x) = c1 x - c2 x - c3 , где c1 =200, c2=130, c3 = 20, =0,7.
Тот же аппарат позволил решать и ещё одну важную прикладную задачу (упомянутую ранее – переход от графика к формуле): получать зависимость, отвечающую некоторым наблюдаемым данным. Зависимость выбранного вида (например, многочлен) с неопределёнными коэффициентами должна дать минимум сумме квадратов отклонений теоретических значений от наблюдаемых. Этот метод получил название «метод наименьших квадратов» и широко используется в самых разных науках, несмотря на известные недостатки его. Например, оценкой величины Х по известным результатам ее измерений xi (i=1,2,…,n), будет число , которое минимизирует выражение
.
В другом примере использования метода наименьших квадратов предположим, что есть некоторые результаты наблюдений (x1,y1), (x2,y2),…, (xn,yn) и предполагается или точно известно, что между переменными x и y имеется линейная связь . Тогда параметры a и b можно оценить по методу наименьших квадратов, определив их такими, которые минимизируют выражение
.
Пример. Результаты наблюдений заданы парами (1;1,0), (2;1,5), (3;1,7), (4;2). Тогда можно найти линейную связь между переменными x и y, наилучшим образом соответствующую данным наблюдениям.
Для этого построим задачу минимизации функции
F(a,b)=.
Значения a и b можно найти из системы уравнений
После несложных преобразований получим
График полученной линейной зависимости у=0,54x+0.19 изображен на рисунке 6.
Рис 6. График линейной зависимости у=0,54x+0.19
Открытие и развитие дифференциального исчисления явилось очень важной вехой в развитии математики, дав общий метод решения этих задач (до тех пор каждая задача требовала индивидуального подхода). Как всякое крупное открытие, оно привлекло внимание философов, осмысливавших его – от самого Г. Лейбница до К. Маркса.
Важным моментом изучения математики на методологическом уровне является оценка роли и места «экзотических» примеров функций – не имеющих производной ни в одной точке, полностью заполняющих единичный квадрат и т.п. Эти примеры крайне важны для понимания условий непрерывности и гладкости, но в практике не играют существенной роли. Они существенны как напоминание о «подводных камнях», которые могут встретиться при исследовании (хотя и крайне редко). То же относится и ко многим распространённым методам. Словом «Не так страшен чёрт, как его малюют»!
Можно отметить и ещё один характерный момент исторического развития математики. В школе многим с трудом давалась геометрия, так как для решения геометрических задач нет «железных правил», требуется индивидуальный подход и пространственное воображение. Поэтому величайшей заслугой Рене Декарта было «сведение геометрии к алгебре», разработка основ аналитической геометрии.
Пример.
Но наука, как и всё познание мира человечеством, развивается по спирали! И в ХХ веке возник обратный процесс: далеко продвинутые отрасли математики (алгебра, функциональный анализ и т.п.) получили «геометрическую интерпретацию». Было введено, разработано и использовано понятие функционального пространства. Не давая здесь его определения, отметим, что при этом сложные математические объекты могут рассматриваться как точки обычного, привычного геометрического пространства. На этом языке удобно описывать и литературные произведения, тексты, отмечать сходство и различие классов статей и книг (например, характеризуя их длиной фраз и слов). ?? Схемы Бачуриной?
- Интегральное исчисление и его приложения.
Мы очищаем место бою
Стальных машин, где дышит интеграл,
С монгольской дикою ордою!
А.Блок, Скифы.
Обращение операции дифференцирования. – Грамматика и
Словарь интегрирования. – Необходимость введения «новых» функций.
- Интеграл как площадь – Методы вычисления интегралов
Выше уже отмечалось, что основной путь развития математики – это обобщения введённых понятий и операций, а также обращение введённых операций. То же произошло с дифференциальным исчислением.
Обобщения были связаны с увеличением размерности аргумента – рассмотрение многих аргументов, функций от многих переменных, введение «частных производных» (по одному из многих аргументов), производных по направлению. Эти обобщения не представляли больших трудностей и были легко реализованы.
Обращение операции дифференцирования – поиск исходной функции (первообразной, интеграла) по её производной, - оказалось более трудной задачей. По шутливому выражению одного из самых остроумных преподавателей РГУ Е. Л. Литвера «дифференцировать можно научить даже обезьяну, а интегрировать – не всякого студента»*.
И дело не в технических трудностях (они в последнее время могут считаться снятыми, так как в программное обеспечение компьютеров теперь включены блоки, реализующие поиск интеграла, первообразной). Оказалось, что далеко не все элементарные функции имеют первообразную, выражающуюся через конечную комбинацию элементарных функций!
Как и в обращении арифметических операций, операций над величинами, обращение операций над функциями потребовало расширение класса рассматриваемых функций.
Интегральное исчисление также имеет свою грамматику (общие правила) и свой словарь – значительно более сложный, чем при дифференцировании.
Таблица 6
Грамматика | | Словарь |
Общие правила интегрирования | | Основные интегралы |
| | Степенные функции |
| | +С (n -1) |
Правило подстановки | | +С |
Если x=(t), то | | Тригонометрические функции |
Правило интегрирования по частям | | +С |
| | +С |
| | +С |
| | +С |
| | Показательная функция |
| | +С |
| | Дробные рациональные функции |
| | +С |
| | +С |
Кроме того, оказалось, что процедура интегрирования тесно связана с широким классом практических задач – вычисления площадей, объёмов, моментов инерции, осреднённых значений, решения уравнений, включающих производные, дифференциальных уравнений, описывающих различные динамические и распределительные процессы. Эти вопросы, на первый взгляд, далеки от проблем и интересов филологов, но хотя бы поверхностное знакомство с аппаратом математического анализа необходимо для изучения (или хотя бы знакомства) теории вероятностей и математической статистики, «выход» которых в филологию очевиден и будет рассмотрен дальше.
И для этих задач создание интегрального исчисления позволило предложить общие методы, взамен индивидуальных приёмов, например, «метода исчерпывания», применявшегося Архимедом, или метода тонких слоёв, применявшегося Кавальери. Геометрическая интерпретация производных (как углового коэффициента касательной к кривой в данной точке) и интегралов (как площади под рассматриваемой кривой) позволило разработать процедуры вычисления этих величин с требуемой точностью, особенно важные в связи с применением компьютеров. Примеры? Сегмент параболы - Архимед
Формализация этих процедур привела к расширению и усовершенствованию понятия алгоритма – последовательности действий, приводящих к получению нужных величин или функций. Это понятие является ключевым для работы с компьютером, но аналог его легко проследить в бытовых условиях (алгоритм кипячения воды5 или молока, алгоритм анализа слова или предложения и т. д.). Вопросам построения и анализа алгоритмов будет уделено особое внимание при изучении основ информатики.
Филологи неоднократно, хотя и несколько поверхностно, обращались к понятию интеграла:
Народ есть некий интеграл
Отдельных личностей,
Которых Бог не зря собрал
В таком количестве.
В. Уфлянд
- Множества, мера и их применения.
“Raffiniert ist der Herr Gott, aber boshaft ist er nicht”
(Господь Бог изощрен, но не злонамерен)
А. Эйнштейн
«Мне казалось, что наиболее достоверно математическое знание. Однако обнаружилось, что многое в этой области, полагавшееся неоспоримым, страдает недостоверностью и что для достижения достоверности необходима новая математика, основывающаяся на более твердых принципах, нежели те, что до сих пор считались достаточными.»
Б. Рассел
Множество – одно из основных понятий современной математики – Действия над
множествами – Конечные, счётные, континуальные множества – Мера множества
- Структура – Обобщения понятия интеграла – Отображения - Приложения
Для математики, как и для большинства других наук, процесс развития идёт по принципу «шаг вперёд, два шага назад». Сначала, без особых обоснований вводятся новые понятия и подходы. Если такой, несколько авантюрный прорыв оказался удачным, позволил получить новые результаты (шаг вперёд), возникает необходимость вернуться назад, оглядеться, обосновать введённые понятия и методы, найти границы их применимости (два шага назад).
Таким обоснованием и понятия числа, и понятия функции, и роли новых классов функций явилась разработка теории множеств.
Множество – простейшее, первоначальное математическое понятие, не определяемое, а лишь поясняется примерами. Это – совокупность некоторых объектов (людей, слов, чисел, функций,…).
В качестве иллюстрации множество представляется некоторой двумерной областью как совокупностью принадлежащих ей точек (непрерывной или дискретной). Характеристикой множества является его мера – аналог площади области или числа содержащихся в множестве точек, элементов.
Естественно вводятся операции над множествами – пересечение, объединение, дополнение (также хорошо интерпретируемые областями на плоскости и тесно связанные с математической логикой – алгеброй множеств).
Так, пересечение двух множеств A и B состоит из элементов, принадлежащих одновременно двум множествам. В диаграммах Венна множество изображается в виде круга, а пересечение двух множеств изображается областью, которая является общей для этих кругов. На рисунке 7 пересечению соответствует область, заштрихованная одновременно вертикальными и горизонтальными линиями
Объединение двух множеств A и B состоит из элементов, принадлежащих хотя бы одному из этих множеств, и в диаграмме Венна ему соответствует область, покрываемая кругами, изображающими данные множества. На рисунке 8 объединению соответствует область, заштрихованная горизонтальными линиями.
Дополнение множества А до универсального множества Е (оно изображается прямоугольником) состоит из элементов универсального множества, не принадлежащих множеству А. По диаграмме Венна дополнение изображается той частью универсального множества, которое остается после удаления из него точек круга, изображающего множество А. На рисунке 7 дополнение множества А до универсального множества Е представлено не заштрихованной частью прямоугольника.
Разность двух множеств B \ A состоит из элементов множества В, не принадлежащих множеству А. На рисунке 8 разность двух множеств B \ A изображена областью, заштрихованной только вертикальными линиями.
В математике используется понятие мощности множества, которое может быть определено как количество элементов, составляющих это множество. Мощность множества А обозначают А. Если множество А не содержится полностью во множестве В, то В\А=В- АВ . Мощность объединения двух пересекающихся множеств можно найти, зная мощность каждого и мощность пересечения этих множеств, по формуле АВ=А+ В- АВ .
Рис.7. Диаграммы Венна, изображающие пересечение двух множеств AB и дополнение множества .
Рис. 8. Диаграммы Венна, изображающие объединение двух множеств AB и разность двух множеств B \ A.
Упражнение. Согласно проведенному исследованию, из 200 человек, смотрящих телевизор, 110 смотрят спортивные передачи, 120 – комедии, 85 предпочитают драмы, 60 человек смотрят драмы и спорт, 70- комедии и спорт, 55 смотрят комедии и драмы и 30 человек смотрят все три вида передач. Сколько человек не смотрят ничего из выше перечисленного?
Круги в диаграмме Венна изображают множество людей, смотрящих драму – круг D, смотрящих комедии – круг К, смотрящих спортивные передачи – круг С. Согласно условию каждая пара множеств имеет непустое пересечение. Поэтому на рисунке 9 круги попарно пересекаются и DC=60, KC=70, DK=55. Все три множества тоже пересекаются, так как есть телезрители, которые смотрят все три вида передач – их 30 человек. Поэтому DCK=30.
Рис. 9. Диаграмма Венна, моделирующая ситуацию, сформулированную в упражнении.
Обозначим множество, состоящее из людей, смотрящих хотя бы одно из выше перечисленного, буквой A.
Тогда, A= KDC , и искомое число людей, смотрящих хотя бы одну из передач, есть мощность этого множества.
A= K+ D+ C - KD - DC - KC +DKC= =120+85+110-55-60-70 +30= 160.
Ничего не смотрят из выше перечисленного 200-160 = 40 человек.
Связь между элементами различных множеств является отображением, и в это понятие укладываются и свойства чисел (зачастую неожиданные), и понятие функции, и дальнейшие, возникающие в математике понятия.
Одним из таких важнейших понятий является понятие «структура (structura – строение, расположение, порядок), совокупность устойчивых связей объекта, обеспечивающих его целостность и тождественность самому себе, т.е. сохранение основных свойств при различных внешних и внутренних изменениях. ( РЭС)» или «В современной. науке понятие С. обычно соотносится с понятиями системы и организации (ФЭС)».
На основе этого понятия можно уяснить смысл введённых ранее математических объектов, ввести классификацию типов отображений и ввести понятие отношения между элементами множеств.
Как всякое понятие, оно также допускает обобщение – основные структуры и построенные на их иерархии составные структуры – например, структура слова (корень, суффиксы и т. д. ) и структура предложения, а далее – всего текста, каждая из которых опирается на структуру предыдущего элемента иерархии.
С такой, более общей точки зрения становятся яснее различные обобщения понятия интеграла, во множестве исследованные в ХХ веке. Простейшее рассмотрение интеграла как площади под кривой на некотором отрезке приводит к двум различным подходам:
- совокупность «вертикальных» столбиков и их предел (при уменьшении ширины каждого столбика) – по Риману;
- совокупность горизонтальных слоёв и их предел (при уменьшении толщины каждого слоя) – по Лебегу.
Второй подход оказался более общим, позволяющим найти интеграл и в тех случаях, когда первый подход приводит к затруднениям. Эти подходы аналогичны двум способам подсчёта рассыпанных на столе денег по отдельным участкам на столе и по количеству монет различного достоинства. На практике пользуются именно вторым способом.
- Комбинаторика и теория вероятностей.
« …и чем случайней, тем вернее
Слагаются стихи навзрыд»
Б. Пастернак
Детерминированность и случайность – Конечное число исходов, их частоты и вероятности
-Биномиальное распределение –Распределение Пуассона – Грамматика и словарь
- Теоремы Маркова – Вероятностные и причинные связи - Приложения и примеры
В предыдущих рассуждениях (и в истории развития указанных разделов математики) предполагалось, что значения всех величин – детерминированы, мы можем присвоить им те или иные значения по своему усмотрению. В то же время уже в древности существовали процессы, где этими значениями распоряжаемся не мы, а «его величество Случай», - например, игра в орлянку или игра Morra, где выигрыш определялся сравнением количества выброшенных игроками пальцев.
Разработка теории таких процессов систематически началась лишь в ХУ11 веке, а в последнее столетие очень активно развивалась для всё более сложных процессов в экономике, политике, в военных действиях.
Простейшим случаем, который здесь изучается, является тот, где некоторая (случайная) величина может принимать – независимо от нашего желания, - лишь конечное число значений (исходов). Основной вопрос заключается в том, чтобы как-то оценить возможность интересующих нас, «благоприятных» исходов. К такой оценке можно подойти двумя путями:
- по наблюдениям – если в n испытаниях (или реализациях) k раз мы имели благоприятный исход, то частота благоприятных исходов равна k/n и называется частотой появления благоприятного события;
- по теоретической возможности – как отношение числа K всех возможных благоприятных исходов к числу N всех возможных исходов K/N - эта величина называется вероятностью искомого, благоприятного события.
Теоретически доказано, что при большом числе наблюдений эти величины близки, но для априорной оценки вероятности нужно научиться подсчитывать меру множеста всех исходов и множества благоприятных исходов. Эти множества называются событиями и их мера определяется комбинаторными формулами: числом возможных размещений n элементов в k ячейках, их перестановок и сочетаний (размещений без учёта перестановок). Эти величины определяются соответственно формулами:
Ank =n(n-1)…(n-k+1); Р n= n! = n(n-1)…1= n!; Ckn = (nk )= n! /k! (n-k)!
Последняя величина как раз определяет число k благоприятных исходов («орёл») при игре в орлянку с n бросаниями монеты и при n=5, k =3 равно 10, а вероятность трёх выпадений орла при 5 бросаниях равна 10/32 = 0.3125 (так как всего 25 =32 варианта).
Процесс последовательных испытаний, в каждом из которых благоприятный исход имеет вероятность p (в орлянке, при честном бросании и уравновешенной монете p=1/2) называется процессом Бернулли и вероятности всех исходов описываются известной формулой бинома Ньютона:
1 = (p+q)n = pn + Cn1 pn-1 q +…+ Cnn-1 p qn-1 + qn , ( q = 1- p ).
Биномиальные коэффициенты этого выражения хорошо известны и легко вычисляются с помощью «треугольника Паскаля»:
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
……………………..
Каждый элемент n-й строки, равный сумме двух элементов над ним, даёт соответствующий коэффициент биномиального разложения, а сумма всех элементов строки равна 2n .
Возвращаясь к орлянке, найдём, что вероятность выиграть не менее трёх раз равна сумме трёх первых слагаемых (отвечающих 5, 4 и 3 выигрышам) из 6, то есть
1/32 + 5/32+10/32 = 16/32 =1/2.
Наряду с вероятностями, в изучении случайных процессов играют математическое ожидание или средний выигрыш(при частотном подходе) – он равен сумме выигрышей, умноженных на вероятности каждого исхода, - и среднее квадратическое отклонение от него (при вероятностном подходе его квадрат называется дисперсией).
Если при каждом бросании ставится и выигрывается (или проигрывается)10 рублей, то за 5 бросаний игрок выиграет
50/32 + 40 5/32 + 30 10/32 + 2010/32 + 10 5/32 +01/32 = 800/32 = 25(рублей)
- половину поставленных денег; этого и нужно было ожидать, так как вероятность одиночного выигрыша равна ½. Отметим, что эти средние характеристики, подтверждающиеся при большом числе испытаний, не исключают на практике более высокого выигрыша или полного проигрыша.
Более детальные исследования игрового поведения представляют предмет отдельного раздела математики – теории игр, широко использующего теорию вероятностей. Теории игр, в частности, посвящён фильм «Игры разума», героем которого является лауреат Нобелевской премии Нэш.
Как и ранее, в рассматриваемой области можно выделить грамматику и словарь. Грамматика состоит из общих положений, почти очевидных:
- утверждение полноты – сумма вероятностей всех возможных исходов равна 1;
- теорема умножения – вероятность двух независимых исходов определяется произведением их вероятностей (И-теорема);
- теорема сложения – вероятность хотя бы одного из независимых исходов равна сумме их вероятностей (ИЛИ- теорема).
Если исходы не являются независимыми (формальное определение здесь не приводится), то последняя теорема должна быть подправлена – иначе «вероятность» может стать больше 1 (а, как известно, обязательство пожарных тушить 110% пожаров невыполнимо).
Словарь состоит из расчётов вероятностей для различных типов процессов с дискретными случайными величинами – выше приведен такой расчёт для схемы Бернулли. Приведём ещё один пример. Рассмотрим вероятность того, что случайная величина принимает значение n при математическом ожидании (закон редких событий, закон Пуассона):
pn = n e - / n!
Теория вероятностей всё шире применяется в самых разных областях исследования – в медицине, генетике, истории, криминалистике. Она помогает установить авторство текста, родственные связи, происхождение человека, место производства различных изделий.
Однако следует помнить, что вероятностные связи, мерой которых являются, например, коэффициент корреляции, говорят лишь о возможности причинных связей и вывод о наличии причинной связи может быть ошибочным. Так, коэффициент корреляции между любовью к солёным огурцам и инфарктом миокарда близок к 1, но причинной связи здесь нет. На самом деле в этом случае есть накладка двух явлений: любви к солёным огурцам и склонности к алкоголизму (и то не всегда), и связи между алкоголизмом и сердечными заболеваниями, - тут причинные связи имеют место! Близкими псевдо - доказательствами изобилует «новая хронология» академика Фоменко, смещающая ряд исторических явлений на несколько веков.
Есть ещё один характерный пример, вероятностный парадокс. Одна из замечательных теорем А.А. Маркова в применении к альпинизму звучит так: Поскольку у каждого альпиниста имеется ненулевая вероятность упасть в глубокую трещину, из которой нельзя выбраться, то с вероятностью 1 за конечное время он там и окажется! Однако мы видим, к счастью, множество живых альпинистов! Здесь нет противоречия с теоремой – просто альпинисты прекращают восхождения раньше, чем «срабатывает» теорема.
Комбинаторная теория вероятностей помогает решить многие практические вопросы частотного анализа в лингвистике и литературоведении, помогая оценить объём анализируемого материала и надёжность полученных выводов.
Примеры
- Непрерывные случайные величины.
«Нельзя на одном языке описать никакое сложное явление.»
Нильс Бор
Функции распределения и их свойства, плотность распределения – Статистики (параметры распределения) – Типовые функции распределения – Таблицы и их использование
- Примеры вероятностных расчётов
Если случайные величины – скалярные, одномерные или многомерные, векторные, - могут принимать непрерывное множество значений, то указанные подходы необходимо обобщить. При этом частотный подход, развивавшийся Мизесом, уступил место подходу А.Н. Колмогорова, основанному на мере множеств возможных значений случайной величины, и связанных с ними так называемыми -алгебрами. В одномерном случае, которым изложение здесь ограничивается, всё проще, и может излагаться без применения этого аппарата.
Пусть для начала случайная величина Х принимает все возможные значения от - до +. Тогда можно оценить вероятность (Pr) того, что случайная величина Х принимает значения, не превосходящие числа х, и назвать её функцией распределения: