§2.1. Основной тезис формализации

2.1.1. Познание окружающего мира. Моделирование. Формализация

В разные времена складывались различные способы познания окружающего мира. 

Основатель современного естествознания Галилео Галилей утверждал, что ведущим принципом познания является описание закономерностей  окружающего мира на языке математики. 

Предположим, в процессе наблюдений вы обнаружили некую устойчивую закономерность, например тот факт, что два разных предмета, брошенных с одной и той же высоты, упадут на землю одновременно (Галилей сбрасывал с Пизанской башни в один и тот же момент времени пушечное ядро массой 80 кг и значительно более легкую мушкетную пулю массой 200 г. Оба тела имели примерно одинаковую обтекаемую форму и достигали земли одновременно).

Zoom In

Чтобы увидеть эту закономерность, нужно отвлечься от многих второстепенных факторов: сопротивления воздуха, материала, из которого сделаны предметы, и пр. и сконцентрироваться на главных факторах, в данном случае – на одинаковой высоте. Именно такой подход позволяет убедиться в фундаментальности названной закономерности: она наблюдается не только в Италии, но и в любом другом месте земного шара, не зависит от погодных условий, от того, кто бросает эти камни: мужчина или женщина и т.д. 

Однако выявить такую закономерность – это только первый шаг. Необходимо найти  способ правильно ее описать. Обычный  язык для этой цели  мало подходит, поскольку  он постоянно находится в развитии – появляются новые слова или новые смыслы уже известных слов, корректируются правила грамматики и пр.  Более точным способом описания таких устойчивых закономерностей является использование математических понятий: чисел, алгебраических и геометрических объектов.  Описанием и изучением этих объектов занимается математика. Следовательно, в математике  можно описать и наблюдаемые фундаментальные закономерности.

Классическое естествознание строилось именно по этой схеме Галилея, которая одинаково применима в физике, химии, биологии, географии, информатике и пр. Различие состояло лишь в том, что в физике устойчивых закономерностей  можно обнаружить куда больше, чем в остальных областях. Разрабатывались и совершенствовались приборы наблюдения, но принцип оставался. В свою очередь, необходимость описания и изучения этих закономерностей стимулировала развитие математики.

Положение существенно изменилось в ХХ в., когда физика стала изучать ненаблюдаемые явления, например процессы, происходящие в атомном ядре или далеких галактиках. Как и прежде, описания осуществляются на языке математики,  но в них исчезли наблюдаемые объекты. В этом случае правильность описания опирается на внутренние законы самой математики.

Более того, работая с абстрактными математическими объектами и соотношениями, можно увидеть за ними реальные физические законы, которые подтверждаются или опровергаются при проведении эксперимента.

Эту мысль выдающийся физик ХХ в. П.А.М. Дирак выразил следующим образом: начинать исследование природы надо с красивой математической теории. «Если она действительно красива, – говорит П.А.М. Дирак, – то она обязательно окажется прекрасной моделью важных физических явлений». Вот и нужно искать эти явления, развивать приложения красивой математической теории и интерпретировать их как предсказания новых законов физики – так строится, по словам Дирака, вся новая физика.

Zoom In

В настоящее время данный подход существенно расширился: кроме физических, химических, биологических изучаются также информационные процессы.  Кроме языка математики используется множество формализованных и формальных языков, но общий подход, который называется моделированием, остается прежним.

Основные этапы моделирования состоят в следующем:

Оба этих компонента неразрывно связаны друг с другом.

Рассмотрим сначала формализацию, поскольку именно языковые модели представляют для информатики наибольший интерес.

2.1.2. Основной тезис формализации

С формализаций мы сталкиваемся не только в процессе общения, но и  практически на каждом шагу: формулируем мысли, оформляем отчеты, заполняем всевозможные формуляры, преобразовываем формулы.

В общем виде формализация понимается как сведение некоторого содержания к выбранной форме (содержания текста, смысла научной теории, воспринимаемых сигналов и пр.).

Пример 1

Zoom In

Возможность формализации опирается на фундаментальное положение, которое мы будем называть основным тезисом формализации. Суть его состоит в принципиальной возможности разделения объекта и его обозначения (имени объекта).

Суть объекта не меняется от того, как мы его назовем. Это значит, что мы можем назвать его как угодно, придать его имени любую форму, которая, по нашему мнению, лучше соответствует данному объекту.

Пример 2

Устройство для автоматической обработки информации можно назвать компьютером, электронно-вычислительной машиной, цифровой вычислительной машиной, ЭВМ, ПК. Очень часто его называют просто «комп».

Отрицание тезиса формализации означает, что имя объекта выражает его суть. В этом случае у каждого объекта может быть только одно имя. Такой взгляд существовал в древности.

Пример 3

Ветхозаветный запрет на произнесение имени Бога связан с тем, что оно отождествлялось с самим Богом и произнесение имени расценивалось как прикосновение к Богу, что было допустимо только для избранных. С этим же связан обычай американских индейцев давать имя только взрослому человеку, когда он сумеет как-то проявить себя. В настоящее время этот взгляд находит отражение в распространенном мнении, что имя, даваемое ребенку, влияет на его характер и судьбу.

Пример 4

В качестве примера можно привести эпизод из истории Великой французской революции, взятый из  книги  П.А. Флоренского  «Имена».

Zoom In

Перед судом Конвента предстал некий аристократ  по  фамилии де  Сен-Сир (дословно «святой король»).

Председатель суда задает ему традиционный вопрос:

– Имя?
– де Сен-Сир, – отвечает подсудимый.
– Революция  уничтожила аристократию, – воскликнул один из судей, услышав приставку «де».
– Она  прогнала  священников, – отреагировал другой на слово «Сен».
– И короля тирана, – добавил третий.
– Так Вы Никто,– воскликнул председатель, – а Никто не может быть осужден. Вы свободны.
В этом эпизоде имя человека отождествлялось с ним  самим, что в конечном итоге спасло ему жизнь.

Из основного тезиса формализации следует идея необходимости введения некоторого набора знаков для обозначения разнообразных объектов. Если обозначение мы можем выбрать достаточно произвольно, то набор знаков может быть самым разнообразным.

Пример 5

А, Б, В, Г – знаки для обозначения звуков русского языка
+, -, *, : – знаки для обозначения арифметических операций
– знаки для обозначения направления движения
– знаки для обозначения магнитных носителей информации
– знаки для обозначения операций над множествами
– знаки для обозначения сигнала опасности

Понятие знака является одним из базисных понятий науки (так же как и понятия: информация, подобие, множество, объект), а потому дать его точное определение не представляется возможным. Но можно указать некоторые основные свойства знака, проявляющиеся в подавляющем большинстве знаковых ситуаций. К таким свойствам относятся:

  1. Способность знака выступать как заместитель обозначаемого. В семиотике «обозначаемое» называют денотатом .
  2. Нетождественность знака и денотата – знак никогда не может полностью заменить «обозначаемое».
  3. Многозначность соответствия «знак – денотат».

Первые две особенности вполне понятны, последнюю поясним следующим образом:

Пример 6

Zoom In

С другой стороны, один и тот же объект может обозначаться разными знаками. Например, день, предшествующий сегодняшнему, можно назвать «вчера», «накануне», «вторник» (если сегодня среда), «второй день после последнего выходного», «день радости» (например, потому что в этот день у вас есть урок информатики) и т.д.

Пример 7

Zoom In

2.1.3. Язык как инструмент формализации

Всякое описание объекта, процесса или явления начинается с его обозначения. Свобода выбора обозначений и многозначность соответствия «знак-денотат» создает проблему понимания: какой объект обозначается данным знаком в конкретной ситуации? Причем это понимание должно быть  примерно одинаковым для разных людей. В противном случае общение невозможно. Следовательно, чтобы обеспечить нормальное общение, нужно договориться о правилах использования знаков, то есть разработать язык .

Язык – это знаковая система, используемая для целей коммуникации и познания.

Все языки можно разделить на естественные и искусственные .  Естественными называются «обычные», «разговорные» языки, которые складываются стихийно и в течение долгого времени. История каждого такого языка неотделима от истории народа, владеющего им. Искусственные языки создаются людьми для специальных целей либо для определенных групп людей: язык математики, морской семафор, язык программирования. Характерной особенностью искусственных языков является однозначная определенность их словаря, правил образования выражений и правил придания им значений.

Строго говоря, любой язык – и естественный и искусственный – обладает набором определенных правил. Они могут быть явно и строго сформулированными (формализованными), а могут допускать различные варианты их использования.

Итак, язык характеризуется:

Пример 8

Сравним два описания вечера: «Стемнело. Затопили печку. Сели пить чай».

Или:
«Печка жарко полыхает,
По стене смола бежит,
Вечер в чашке чая тает,
Тень ложится, звук дрожит».

Пожалуй, второй отрывок можно считать менее формализованным и более информативным, поскольку он не только констатирует факт наступления вечера, но и рисует некоторую картину, затрагивая наши чувства и эмоции. Хотя и то и другое описание выполнено в соответствии с правилами русского языка.

Обозначение может скрывать или  проявлять сущность объекта, а также быть от нее полностью  свободным.

Пример 9

Для  нас  является привычным понятия натурального числа. Натуральное число является  абстрактным объектом, выражающим  одновременно количество и порядок. Существует множество обозначений натуральных чисел – нумераций.  Наиболее известными являются  римская и арабская нумерации.   Например, «семнадцать» и «семнадцатый» в римской нумерации записываются как   «ХVII», в арабской – «17».  Арабская нумерация не просто более удобная, – она гораздо информативнее римской нумерации.  Например, в арабской нумерации хорошо видно, что ряд  натуральных  чисел неограничен.  В римской нумерации это увидеть практически невозможно.

Пример 10

На каждом автомобиле принято ставить эмблему фирмы изготовителя:

Zoom In

Такую эмблему можно рассматривать как обозначение  автомобиля, которое никак не  связано с его характеристиками (эмблема не дает описания параметров двигателя, размеров, надежности и т.п.).  

Обозначать объекты без определенных правил можно только до некоторого предела.  Такие правила необходимы, например, для обозначения неограниченного натурального ряда чисел.  Выработанные человеком правила  основаны на конструировании сложных обозначений из более простых. Общая идея этой конструкции хорошо известна. Напомним ее. Необходимо выбрать некоторое число простейших знаков.  Упорядоченный набор таких знаков будем называть алфавитом. Эти знаки часто называют буквами. Конечную последовательность знаков данного алфавита будем называть словом (в данном алфавите). Правила, согласно которым образуются слова из алфавита,  будем назвать грамматикой.  Множество всех слов, записанных в данном алфавите, согласно  правилам заданной грамматики образуют язык.         

Общее правило заключается в том, что всякий предмет обозначается словом в некотором алфавите.  Описание же  предмета  будет состоять из упорядоченного множества  слов.

Пример 11

Снова вернемся к обозначению натуральных чисел.  Идею использования конечного алфавита для обозначения неограниченного количества натуральных чисел  высказал еще Архимед  в трактате «Исчисление песка». Фактически десять цифр 0, 1, 2, … 9  можно рассматривать как буквы  алфавита. Каждое натуральное число – это слово, составленное из этих букв по следующим правилам:

Пусть для  числа  n  уже имеется запись указанными буквами – цифрами. Если последняя цифра отлична от 9,  то для получения записи следующего числа  n+1 нужно эту последнюю цифру заменить следующей, а все другие цифры оставить без  изменения.  Если  же  последней цифрой  числа n является 9,  то она заменяется на 0,  и вместе с ней по тому же правилу меняются цифры в более старших разрядах. Такой способ записи чисел, использующий информацию о месте (позиции),  на котором стоит данная цифра – величина числа, зависит от того,  стоит,  к примеру,  цифра 7 в разряде десятков или сотен, называется позиционной нумерацией или системой  счисления.  Поскольку  алфавит  данного языка содержит 10 цифр, эту нумерацию называют десятичной.

Позиционная система  счисления была придумана еще в древнем Вавилоне. Архимед обосновал, что этот способ (в отличие от нумерации  римскими цифрами) годится для всех натуральных чисел сразу. Правда, вавилонская нумерация была не десятичной, а шестидесятеричной, т.е. в ней использовалось шестьдесят цифр!

При обозначении предметов словами в некотором языке могут реализоваться следующие возможности:

Zoom In

В первом случае, когда один и тот же объект может обозначаться различными словами, говорят о синонимии. Напротив, когда  одно слово служит обозначением нескольких объектов, его называют омонимом.  Омонимия и синонимия, как правило, присущи естественным языкам, в которых обозначение объектов формировалась стихийно, в течение длительного времени. В  формальных языках  придерживаются  взаимно однозначного соответствия: «объект – слово», а  кроме того, жестко прописаны правила образования слов – правила грамматики.  Если  соответствие  «объект – слово»  и правила грамматики являются крайне желательными, но все же не всегда выполняются, то такой язык называется формализованным.  Наиболее известным формализованным языком является язык математики.      

Современный человек живет в мире самых разнообразных языков.  Большинство объектов он познает не путем их непосредственного созерцания и  непосредственной деятельности с этими объектами, а путем интерпретации   слов в  некотором языке.

2.1.4. Формализация и моделирование

Язык выступает инструментом, с помощью которого можно создавать различные конструкции для описания объектов, их внешнего вида, свойств, структуры, поведения, отношений между ними и пр. Создание различных конструкций, которые «описывают» тот или иной объект, называется моделированием. Языковые конструкции внешнего вида, свойств, структуры, поведения, отношений между объектами являются информационными моделями. Об этом речь пойдет в следующих параграфах.

Любое общение невозможно без того или иного уровня формализации информации. Любой язык, естественный или искусственный, является одним из способов ее формализации. Разница в том, что специальные языки (языки формул, языки программирования и т.п.) – это строго формализованные системы, а естественные (разговорные языки, языки искусства, языки мимики и жестов и т.п.) – частично формализованные системы.

Многие проблемы представления и передачи знаний (обучения) связаны с проблемами их формализации.

Знания – это воспринятая, осознанная и ставшая личностно значимой информация.

В процессе познания, в результате непосредственных наблюдений, проведения экспериментов мы получаем информацию. Формализация полученной информации есть один из компонентов процесса ее осознания.

Языковая система, в рамках которой производится формализация, имеет свои выразительные возможности и тем самым накладывает ограничения на выбор формы.

Так, словесное описание можно успешно применять при моделировании внешнего вида, менее эффективно оно при моделировании структуры. Моделирование же поведения посредством словесного описания хоть и привычно для нас, но менее наглядно по сравнению, скажем, с видеофильмом.

Пример 12

Zoom In

Язык рисунков используется в основном для моделирования внешнего вида. Смоделировать поведение объекта в одном рисунке практически невозможно, для этого потребуется серия рисунков.

Языки чертежей, схем, таблиц лучше всего подходят для моделирования структуры объекта.

Наибольшую сложность для информационного моделирования представляет поведение объекта, поскольку оно обязательно включает такой параметр, как время, но анализ таких моделей дает наибольшую информацию об объекте. Именно поэтому моделирование динамических процессов и имитационное моделирование сложных биологических, технических, социальных систем представляют большой практический интерес.