N-T.ru / Раритетные издания / Николай Петрович

Люди и биты. Информационный взрыв: что он несет

Николай ПЕТРОВИЧ

Что такое биты и что они несут?

Люди

Люди. Кто они? Это ясно – обитатели нашей планеты, человечество. Как определяли в старину – «все и всяк». А кто этот всяк? Тоже ясно – гомо сапиенс, человек разумный, существо, поступки которого определяет разум.

Откуда он? Это уже менее ясно. В большинстве случаев рисуют такую картину. Несколько миллиардов лет назад «в теплом, густом, соленом бульоне», который заполнял впадины планеты, возникла живая клетка, способная к размножению, к продолжению своего рода. С нее все и началось. На планете произошел таинственный революционный скачок «неживое-живое».

– Я читал, что первый скачок, первая клетка возникла совершенно случайно благодаря удачному столкновению больших молекул, хаотически двигавшихся в бульоне. Следовательно, появление земной цивилизации зависело от этого счастливого столкновения. Так ли это?

Наш Оппонент начал свою первую атаку на автора, пожалуй, с самого трудного вопроса – как зародилась жизнь на Земле? Возникновение живого из неживого – одна из великих тайн. Философы, биологи, химики ожесточенно спорят о возможном механизме этого явления.

Одни считают зарождение жизни случайным явлением. Другие полагают, что переход «неживое-живое» есть результат закономерного развития форм движения материи. Единого мнения на этот счет пока нет. Разрешить загадку чисто теоретически вряд ли когда-нибудь удастся. Не хватает отправных экспериментальных данных. Есть два пути их получения. Один – синтезировать живую клетку в земной лаборатории. Как говорят биологи, получить жизнь«в пробирке». Второй – установить какие-либо контакты о очагами жизни на других космических телах.

Правда, есть одна теория, которая очень просто объясняет возникновение жизни на Земле. Это так называемая теория панспермии. Споры микроорганизмов либо занесены на Землю с метеоритами, либо «прибыли» из космоса под давлением света, либо посланы внеземной цивилизацией. Но эта теория, к сожалению, также не объясняет образования органической материи из неорганической, а лишь переносит загадку на другие небесные тела.

Но так или иначе, закономерно или случайно – живые клетки возникли на нашей планете. Далее следуют миллиарды лет развития возникшей жизни при действии двух факторов – борьбы за существование и мутаций в живом организме.

Несколько миллионов лет назад произошел второй не менее важный революционный скачок «живое-разумное». От него берет начало род людской. Тут уже почти никаких таинств нет. Ф. Энгельс дал предельно лаконичное объяснение этого скачка: «Труд создал самого человека». Имеется в виду коллективный труд, который был, есть и, вероятно, навсегда останется главной чертой человека и человечества.

С давних времен и до наших дней человек пытается понять и объяснить явления, происходящие в окружающем его мире. Одна из первых моделей мира, возникшая в сознании первобытных людей, была наивна и проста. Есть одно или несколько таинственных существ, которые, дергая тысячи «ниточек», управляют миром, как марионеткой. Затем, варьируя эту модель, люди придумали множество таких неземных богов, дали им имена, поклонялись им тысячелетия, часто в своих молитвах просили помощи и защиты у них.

Даже Солнце – этот огненный шар с температурой в миллионы градусов, этот не знающий передышки атомный реактор – не раз бывало божеством.

Так, египетский фараон Аменхотеп IV в борьбе с многобожием провозгласил единственным богом наше светило. Дал ему новое имя – Атон, а себя скромно назвал лишь тенью его на Земле – Эхнатоном.

Практический опыт человечества, развитие науки и техники, постепенно сломали веру в божественные силы. Вместе с тем еще и сегодня на земном шаре есть племена, отставшие в своем развитии, которые продолжают верить в эти силы. И в развитых странах есть люди, верующие в бога. Правда, их становится все меньше.

Начало формирования земной цивилизации обычно связывают с появлением письменности и образованием городов. Случилось это около десяти тысяч лет назад.

Развитие цивилизации коренным образом изменило условия жизни человека и, конечно, его самого. Так, быт современного человека совсем не похож, на быт первобытного пещерного обитателя.

Сегодня человек не карабкается по отвесной скале, да еще с добычей на плечах в свою недоступную зверям пещеру. Его возносит скоростной лифт. И не в пещеру, а в современный комфортабельный ее аналог. Он в тысячу раз лучше защищен от холода, дождя, снега, ветра. Вековая забота о хворосте и дровах для очага исчезла. Достаточно повернуть ручку, и совершится «чудо»: зажигается маленькое домашнее электрическое «солнышко» или вспыхивает газ.

Конечно, пламя газовой горелки нельзя сравнить с пламенем костра, которым согревались и любовались наши далекие предки, а сегодня, любуются геологи, туристы, охотники... Но это небольшая плата за большой комфорт.

Первые племена рода человеческого были немногочисленны, и их особи поначалу общались между собой с помощью нечленораздельных звуков, жестов, мимики.

Сегодня род людской расселился по всему земному шару. Становится тесновато. Уже подумывают о создании колоний в космосе и в океанах. Вместо примитивных методов общения человеком созданы сотни красивых, звучных национальных языков. Тысячи переводчиков, благородных посредников, ломают языковые барьеры, позволяя землянам понять друг друга.

Несмотря на миллионы лет суровой борьбы за существование, а может быть, именно благодаря им человек развил в себе новые прекрасные качества. Они хорошо известны и украшают род человеческий: любовь и дружба, мечта и фантазия, самоотверженная борьба за лучшее будущее человечества... Это породило духовный мир человека. Окружающий материальный мир, образно отраженный в сознании людей, нашел удивительное воплощение в песнях, танцах, музыке, стихах. Отсюда непосредственно следует, что и песни, и стихи, и музыка как бы живут в самой природе. Правда, пока еще не все это чувствуют и понимают.

Одна из основных черт человека – неугасимый интерес ко всему его окружающему, вечный неутолимый голод познания. Это так прекрасно выразил Уолт Уитмен:

«Сегодня перед рассветом я взошел на вершину горы и увидел кишащее звездами небо и сказал моей душе:

– Когда мы овладеем всеми этими широтами Вселенной, и всеми, их усладами, и всеми их знаниями, будет ли с нас довольно?

И моя душа сказала:

– Нет, этого мало для нас, мы пойдем мимо и дальше».

В самом деле, человека не поглотили земные, большие и малые дела. С давних времен он вглядывался в небо, пытаясь проникнуть мыслью в глубины Вселенной. Сегодня он туда проникает не только мыслью и телескопом, но и на своих кораблях. Первым землянином, который смело разорвал вековые цепи тяготения планеты, был Юрий Гагарин. Он пробыл в космосе 108 минут. Космонавты Владимир Соловьев, Леонид Кизим, Олег Атьков пробыли в космосе 237 суток. Это уже не визит за пределы Земли, а более чем полугодовая жизнь там.

Земляне уже вчерне набросали картину той части Вселенной, которая доступна глазу и самым чувствительным современным приборам. Она и поражает, и вызывает законную гордость людей.

Измерено расстояние до очень удаленных объектов, так называемых квазаров. Оно составляет более десяти миллиардов световых лет. Это значит, что регистрируемое нашими приборами излучение покинуло квазар задолго до образования Солнечной системы. Далее оценено общее число звезд и число галактик, в которые они объединяются. Наконец, установлен тончайшими измерениями потрясающий факт: галактики разбегаются друг от друга, наблюдаемая Вселенная, называемая Метагалактикой, непрерывно расширяется.

В картине Вселенной человек сумел определить место своей «стоянки» и сегодня может уверенно отметить его крестиком. Вот оно. Мы живем на третьей планете рядовой звезды, именуемой в каталогах астрономов «желтый карлик», затерянной в одном из крайних рукавов Галактики, опять-таки рядовой спиралеобразной звездной системы, называемой землянами Млечный Путь. (Чтобы отличить свою родную галактику от миллиардов других, мы пишем ее с большой буквы – Галактика.)

Наша Галактика вместе с ближайшей к нам галактикой Магеллановы Облака, знаменитой галактикой Туманность Андромеды и более десятка других галактик образует местную систему галактик, входящую опять-таки как рядовой объект в Метагалактику. Последняя охватывает часть Вселенной, доступной современным методам исследований, и поэтому имеет еще одно название – астрономическая Вселенная.

Итак, наша любимая звезда, источник жизни, возвеличенная в стихах и песнях, бывшее божество, есть скромный «желтый карлик» в картине Вселенной. Нелегко было человеку признать это. Но истина выше тщеславия.

Не менее удивительны и величественны результаты, полученные при изучении структуры материи. Человек не только раскрыл процессы, происходящие в микромире – мире молекул, атомов, протонов, электронов, элементарных частиц, но и частично научился управлять ими. Пример этому – первая в мире атомная электростанция, построенная в нашей стране. Сейчас уже тысячи их служат людям на всей планете.

Одно из последних великих деяний человека выглядит наиболее дерзко.

Человеческий мозг, который мы уже окрестили и Великим Консерватором, и Великим Открывателем, и Новатором, начал не справляться с решением задач, им же самим поставленных. Дальнейшее развитие науки и техники требовало куда большей скорости и большей точности расчетов, чем давал Великий Консерватор. Тупик? Но недаром он же и Великий Новатор. Он нашел блестящий выход из тупика. Были созданы быстродействующие помощники Консерватору.

Поначалу ЭВМ просто считали за него, но быстрей и точней (если, конечно, исправно работали). Первые такие помощники были громоздки и часто выходили из строя.

Сегодня ЭВМ уже не только считают, но и проектируют, управляют и даже начинают творить новое. То ли еще будет!

Биты

Почему так легко шагается, словно крылья выросли? Почему так радостно на душе? Да ведь я спешу в аэропорт, первый раз лечу за рубеж! Первый раз буду выступать там перед коллегами с докладом! Первый раз испытаю в реальных условиях свой английский, который столько лет учил.

Но где же автобус? Нет и нет. Наконец показался. Но эта четырехколесная черепаха еле ползет. Она погубит меня. Наконец, аэропорт. Преодолевая заслоны, выбегаю на взлетное поле. Два самолета справа от меня и два слева. На всех четырех заканчивается посадка. Куда бежать? Кого спросить? Догоняю автокар. Кричу что есть мочи: «Куда на Нью-Йорк?» Водитель, даже не оглянувшись, выбрасывает правую руку. Мое незнание уменьшилось в два раза. Я получил один бит информации.

Сворачиваю направо. Какой из двух? Подбегаю к первому: «Нью-Йорк?» Стюардесса отрицательно качает головой. Я получил второй бит информации. Незнание снято. Мчусь ко второму. Трап начинает медленно отходить. Взбегаю по нему, бросаю в еще приоткрытую дверь портфель и сам прыгаю за ним... Итак, два бита сделали доброе дело, и я уже полулежу в удобном кресле, расслабился и готовлю вступление к докладу: «Леди и джентльмены, коллеги и друзья... »

А сколько бит информации понадобилось бы, если бы с каждой стороны было бы по четыре самолета? Легко видеть, что после получения первого бита информации – «справа или слева» – ситуация приводится к предыдущей. Следовательно, чтобы найти свой заветный самолет среди восьми, потребовалось бы три бита информации. Продолжая наращивать число самолетов C, получаем табличку необходимой для поиска информации U:

число самолетов Cчисло битов U
42
83
164
325
646

Из этих цифр в глаза бросается простая зависимость C = 2U.

Если взять логарифм от этого выражения по основанию два, то получим удобную формулу: U = log C.

Понятно, что она относится не только к поиску самолета, а к любому выбору из большого числа равновероятных возможностей.

Она устанавливает простой факт: «Информация, необходимая для выбора равноправных вариантов, равна логарифму числа вариантов».

– Почему вы брали число самолетов, только равное двойке в степени целого числа?

– Для простоты счета и наглядности.

– А если брать любое число? Например, сколько бит понадобилось бы гоголевской невесте для выбора одного из семи женихов?

Действуем так же. По нашей формуле находим: U = log 7.

Теперь придется заглянуть в таблицу логарифмов. Получаем: U = 2,807 бит.

Предположим, привередливая невеста решила доверить выбор случаю. Ей пришлось бы, округляя полученный результат, бросить монету не более трех раз.

Как мы все помним со школьной скамьи, логарифмическая функция увеличивается с ростом числа очень медленно. Так, если бы число самолетов было бы 512, то для поиска единственного нужного потребовалось бы всего 9 бит информации или 9 ответов типа ДА-НЕТ. При гигантском числе самолетов С-4096 потребовалось бы всего 12 бит информации и т.д.

Теперь мы можем воспользоваться полученной нами формулой и уточнить понятие «бит». Если принять число вариантов (или число возможных исходов) минимальным – равным двум, то получаем количество информации, необходимое для выбора: U = log 2 = 1.

Эта величина и была названа двоичной единицей. Или по-английски binary digit. Сокращение от этих двух слов и дало bit. Или в русской транскрипции бит. В нашей литературе встречаются три названия: «двоичная единица», «бинарная единица» и «бит». Это одно и то же.

Итак, 1 бит – это элементарное количество информации, необходимое для выбора из двух возможностей.

Кроме слов ДА-НЕТ, есть сотни способов передать информацию с помощью бит. Кто не подсказывал приятелю в школе и даже в институте только движением головы?

Сверху вниз – ДА, повороты в стороны – НЕТ. Если на окне стоит букет цветов, значит, можно заходить в гости.

Если не стоит, то родители в дурном расположении духа и надо ждать у дома. Зеленая ракета – это ДА, а красная – это НЕТ.

Часто при передаче по проводам и кабелям ДА – это плюсовая посылка (+), НЕТ – это минусовая посылка (–). Если радиоволна передает биты, то тут много возможностей. Наличие излучения радиоволн – ДА, его отсутствие – НЕТ; излучение на частоте f1 – ДА, на частоте f2 – НЕТ; если интервал между двумя импульсами ∆t – ДА, интервал 2∆t – НЕТ и т.д.

Перфолента прекрасно вводит биты в электронные вычислительные машины: ДА – это дырочка в ней, НЕТ – ее отсутствие. С легкой руки математиков наиболее ходовой записью ДА-НЕТ стали цифры 1 и 0.

Представим себе, что нам вместе поручили придумать командные сигналы для двух необитаемых искусственных спутников Земли (ИСЗ). Первый ИСЗ метеорологический. Для его управления требуется сто различных команд. Второй ИСЗ исследует природные ресурсы планеты путем фотографирования поверхности на различных волнах – радио, оптических, рентгеновских. Здесь аппаратура более сложная, и для управления требуется 1000 команд. Команды должны быть составлены из простейших посылок типа ДА-НЕТ.

Наша задача сводится к определению минимального числа посылок в каждой команде.

Из теории соединений, которую мы все проходили в школе, не подозревая тогда, что она имеет отношение к космосу, находим, что число команд или число различных комбинаций N, составленных из n-элементов, каждый из которых может принимать т различных значений, равно N = mn.

Нам заданы двоичные посылки, следовательно, m = 2. Составляя команды из разного числа посылок, начиная от одной и кончая 15, получаем число команд:

n123456789101112131415
m24816326412825651210242048409681921638432768

Из таблички следует: для первого ИСЗ команда должна содержать не менее семи посылок, а для второго не менее десяти. При этом в первом случае в резерве остается 28 команд, а во втором – 24.

Найденные нами команды будут безупречно управлять ИСЗ, к сожалению, только в одном единственном случае – при отсутствии заметного уровня помех как в среде распространения, так и в приемнике на ИСЗ.

– Но ведь это невозможно!

– Полностью согласен. Нам придется применить защиту от помех. Что мы делаем, если плохо слышно по телефону? Повторяем. Поступим так же. Повторяя команду, например 5 раз, и накапливая ее в приемнике, мы победим многие помехи. Пока заметим, что повторение есть простой и удобный, но очень неэкономичный способ защиты.

Наша табличка подсказывает, что из бинарных сигналов можно построить не только команды, но даже разговорный язык.

Так, словарь А.С. Пушкина содержит 30 000 слов. Значит, составив комбинацию звуков типа ДА-НЕТ из пятнадцати элементов, можно за каждым словом закрепить одну из них и таким способом построить язык из 30 000 слов! В быту мы пользуемся числом слов порядка 1000 и нам хватило бы комбинации из десяти элементов. А если вспомнить Эллочку Людоедку, обходившуюся 30-ю словами, то тут хватит комбинации всего лишь из пяти ДА-НЕТ.

К счастью, формирование речи у наших далеких предков не пошло по этому пути, и нам не приходится выкрикивать эти длинные комбинации из ДА-НЕТ и напряженно их разгадывать на слух. Кроме того, речь при этом стала бы куда длиннее, а книги значительно толще.

Слова в нашем языке набираются не из двух различных кирпичиков ДА-НЕТ, а из... 32. Эти кирпичики есть буквы нашего алфавита. Для подсчета числа возможных различных комбинаций из них надо в нашей формуле считать m = 32. Придавая n, числу букв в слове, различные значения, получаем таблицу:

n1234
m321024327681048576

Неожиданный результат. Составляя слова только из трех букв и используя все возможные комбинации, получаем число слов более 30 000. При четырехбуквенных словах число слов переваливает за миллион! Но ведь средняя длина слова в русском языке составляет около семи букв. Значит, мы с вами, читатель, открыли простой способ сделать речь человека в два раза короче.

– Вы утверждаете, что докладчик может говорить в два раза короче, что книги могли бы стать в два раза тоньше?

– Принципиально такая возможность есть. Это доказывает наша простая табличка.

– Как возликовали бы школьники, студенты, все пишущие и читающие. Ведь это экономия времени в два раза.

– Согласен.

– Почему же эволюция упустила этот заманчивый путь построения языка и почему мы, установив такую возможность, не переходим на этот путь краткого общения?

К сожалению, в угоду краткости пришлось бы пожертвовать красотой и благозвучностью языка, разборчивостью слов, особенно при наличии шума, однозначным восприятием слова...

Трехбуквенный язык вряд ли вдохновлял бы Лермонтова на такие строки:

Есть сила благодатная
В созвучье слов живых,
И дышит непонятная,
Святая прелесть в них.

Из наших простых расчетов следует еще один любопытный факт. Запишем все возможные комбинации, составленные из двух элементов типа ДА-НЕТ: 10, 01, 11, 00. Их всего четыре. Теперь попытаемся записать все возможные комбинации, составленные также из любых двух букв русского алфавита; аа, аб, ав, аг... ба, бб, бв, бг...

– Может, хватит? Нам придется заполнить уйму страниц этими сочетаниями.

Оппонент прав. Ведь мы подсчитали их число: 1024!

Сопоставим результаты. В первом случае мы получили только четыре комбинации или команды, а во втором их в 256 раз больше! Объяснение факта простое: в первом случае – одна посылка или один элемент сообщения принимает только два значения, во втором – 32. Следовательно, чем больше значений может принимать элемент, тем больше информации он несет. Так, при одинаково частом следовании 1 и 0 и всех букв алфавита в сообщениях одна двоичная посылка несет, как мы установили, информацию лишь в 1 бит, а одна буква алфавита: U = log m = log 32 = log 25 = 5 бит.

– Значит, сигналы ДА-НЕТ есть предельные информационные бедняки. Почему же их так широко применяют?

Бедность, как известно, не порок. Посылки ДА-НЕТ имеют много золотых качеств: лучше всех других сражаются со своими врагами – вездесущими помехами, аппаратура для их передачи и приема наиболее проста и надежна, они удобны для запоминания и разных математических действий.

Кроме того, есть ситуации, когда этот бедняк вдруг становится... миллиардером. До этой его тайны мы еще доберемся.

Как быть с П. Чайковским?

Мы установили, что посылки ДА-НЕТ и посылки, более богатые информацией, могут передавать команды, буквы, письменную речь...

– А как быть, например, с первым концертом П.И. Чайковского? Разве можно его передать, используя только ДА-НЕТ?

– Оказывается, можно. Более того, можно передать не только любые звуки, но и любое изображение. Пройдет немного времени, и можно будет, например, смотреть «Лебединое озеро» дома на экране телевизора не только в цветном, как сейчас, но и в объемном изображении. При этом между Большим театром и вашим домом будут сновать только биты, только посылки ДА-НЕТ.

– Сомнительно! Ведь сигнал звука и изображения меняется плавно, а сигнал, составленный из посылок ДА-НЕТ, – это резкие скачки напряжения.

– Вы правы. Это два, казалось бы, принципиально различных сигнала. Один называют непрерывным или аналогом, а второй – дискретным, прерывистым. Но нас выручает один из вездесущих законов диалектики переход количества в качество. Если мы величину скачка нашего дискретного сигнала будем уменьшать и уменьшать, то различие между аналоговым сигналом и его изображением, составленным из дискретных посылок, будет тоже уменьшаться. Устремив в пределе этот скачок к нулю, получим полное совпадение.

– При этом ведь число посылок возрастает до бесконечности. Никакая реальная система связи с ними не справится.

– Верно. Бдительность уместна. Но нет необходимости устремлять скачок к нулю. Нас выручает другой закон природы. Нет и не может быть абсолютно чувствительных, реагирующих на любое изменение раздражителя или сигнала устройств. Это относится как к биологическим, так и к техническим системам. Например, в некоторых пределах человек совершенно не замечает изменения силы звука или степени яркости изображения.

Объясняется такое несовершенство просто. В любой наблюдающей или измеряющей системе имеются собственные помехи и нестабильности, которые и создают порог чувствительности. Следовательно, лишено всякого смысла делать скачки дискретного сигнала меньше этого порога. Последнее позволяет разбить сигнал на ряд уровней и в каждый момент времени передавать только номер уровня.

Так, для передачи речи, при переводе ее в посылки ДА-НЕТ используется не бесконечное число уровней, а всего лишь 128. При этом абоненты и не подозревают, что они разговаривают не звуками, а только номерами уровней. Поскольку число уровней ограниченно, то каждому уровню легко присвоить свой код или свою команду. Мы уже знаем, что для образования 128 команд, необходима кодовая группа всего лишь из семи двоичных посылок.

Таким образом, мы разделались с интенсивностью передаваемой величины или с амплитудой сигнала в канале связи.

Теперь встает не менее важный вопрос. Как часто надо эти уровни передавать? Раз в секунду, раз в тысячную долю секунды, раз в миллионную долю секунды? Если окажется, что очень часто, то опять невозможно будет реализовать такую передачу.

К счастью, надо передавать не очень часто. В сигнале как бы есть пустая порода, которая не несет информации, и ее преспокойно можно выбросить.

Так, для речевого телефонного сигнала достаточно передать семь тысяч равноотстоящих отсчетов в секунду. Значит, пауза между отсчетами ∆t составляет одну семитысячную секунды. В этом интервале и надо передать наш код из семи импульсов.

– Я не понял, как вы делите сигнал, а следовательно и речь, на пустую породу и крупицы золота, несущие информацию.

– Такого деления нет. Но ход сигнала на каждом небольшом интервале ∆t между соседними отсчетами можно предсказать по его предыдущим значениям.

Это и используется для восстановления сигнала по его отсчетам на приеме. В этом смысле я и назвал интервал ∆t пустой породой.

Отчего зависит этот интервал? Только от скорости изменения сигнала. Чем медленней он меняется, тем реже можно брать отсчеты.

Итак, дробя наше сообщение на уровни и выбрасывая «пустую породу», мы можем любую информацию заменить набором посылок типа ДА-НЕТ. Совершается чудо – первый концерт П.И. Чайковского можно записать на пластинке или магнитофоне только посылками ДА-НЕТ и получить воспроизведение не хуже (и даже лучше), чем при записи аналогового сигнала.

Наличие удивительного интервала «пустой породы» в аналоговом сигнале было установлено В. Котельниковым еще в начале 30-х годов. Теорема, носящая его имя, позволяет легко вычислять этот интервал ∆t в зависимости от свойств сигнала.

Римский или курносый?

Мы уже отмечали, что одна из самых великих тайн природы связана с возникновением на планете живой клетки, способной питаться, чувствовать, двигаться и, самое главное, РАЗМНОЖАТЬСЯ.

– Почему последнее свойство выделено?

– Да потому что только благодаря ему эстафета жизни, говоря олимпийским языком, передается вот уже более трех миллиардов лет (в цифрах это выглядит еще сильнее. 3 000 000 000 лет!) от живой клетки к ее детям, от одного животного организма к его наследникам.

Но что значит передавать эстафету жизни? Это значит создать продолжение рода по своему образу и подобию. Создать не фотографию, а живую копию с живого. Живой организм, как мы знаем, не появляется сразу в готовом виде. Он вырастает из зародыша постепенно. Значит, в зародыше заложена полная информация о будущем организме. Если этот организм имеет, например, нос, то должны быть исчерпывающие данные о его форме и конструкции, о его размерах, о способе функционирования и «стыковки» с другими органами. Словом, полная «конструкторская документация». И так о каждом органе и о всем организме.

– Позвольте, но ведь половая яйцеклетка, из которой развивается весь организм человека, есть крохотный шарик диаметром 0,1 мм. Как там умещается вся эта документация?

– Сомнения Оппонента разделяют многие. Ведь полная документация, например на современный завод, составляет десятки и даже сотни томов. И это, не считая документации на используемые на заводе готовые машины. А ведь человек, несомненно, сложнее любого из существующих заводов!

Тупик? Да. Вот он веками и приводил к вере в божественное начало в человеке, к вере в участие бога в его творении.

В середине XX столетия тайна продолжения рода, продолжения жизни была раскрыта. Природа нашла удивительный и, возможно, единственный путь гигантского сжатия наследственной информации – составление длиннющей телеграммы от родителей к детям непосредственно из молекул и их комбинаций! Там даже записано, какой сотворить новому человеку нос: прямой, римский или курносый.

– – Какая же длина этой телеграммы? Можно ли ее передать по современному нашему телеграфу?

– Телеграмма получается сверхдлинная. При двоичных посылках число их составит, по приблизительным оценкам, сотни миллионов, что соизмеримо с информацией, содержащейся во всех тридцати томах БСЭ.

– Вы утверждаете, что секрет жизни состоит в снятии живой копии с живого. Копии, копии, копии... И так миллиарды лет. А откуда развитие, совершенствование живого? Ведь сколько бы плагиатор ни переписывал чужие работы, он принципиально не может внести ничего нового. Так?

– Если бы так, то возникшая живая клетка преспокойно точно копировала бы себя, то есть продолжала бы свой род, пока условия обитания не препятствовали бы этому. Но ведь окружающая среда меняется. При некоторых изменениях ее параметров застывшие копии неминуемо погибли бы. И второе, не менее важное. Точное копирование не дает новых свойств живому. Если бы все три миллиарда лет условия обитания для живых клеток были бы подходящими, то наша планета и была бы населена только этими живыми копиями. Царил бы скучнейший мир в точности одинаковых простейших живых существ. От этой скуки и застоя спасли нас... те самые информационные посылки, которые обеспечивают точное копирование.

– Каким образом? Ведь они только повторяют?

– Да, повторяют, но и создают новое. Блестящее проявление диалектического единства противоположностей.

– Откуда же новое, более совершенное?

Состояние среды обитания живой материи, зависящее от сотен факторов – температуры, радиации, состава атмосферы, качества воды, состояния почвы и прочего, – на значительных отрезках времени может рассматриваться как случайное явление. Неизменные копии в конце концов должны гибнуть в этой случайной среде. Но Природа, про которую Исаак Ньютон сказал, что она очень хитра на выдумки, противопоставила одному случайному явлению другое. В нарождающемся организме создаются, пока непонятным образом, помехи наследственной информации. Отдельные группы символов у некоторых особей данного вида искажаются. Грубо говоря, часть ДА становится НЕТ, а часть НЕТ становится ДА. Просто, хотя и довольно жестоко.

Эти искажения, называемые мутациями, разрушают картину однообразных копий. Так как мутации искажают наследственный код случайно, то с равной вероятностью они могут создать особь как лучше, так и хуже приспособленную к меняющимся условиям среды. Остальное совершается, по закону естественного отбора, открытому великим Ч. Дарвином: в борьбе за существование в конечном счете побеждают сильные, лучше приспособленные, а слабые погибают.

Таким образом, полезные мутации закрепляются в потомстве и это сразу решает две задачи. Первая – приспособление к изменениям условий обитания. Вторая – дальнейшее совершенствование вида.

Вот эта вторая задача, решаемая путем случайного нарушения наследственной информации, и дала возможность конвейеру жизни пройти путь от простейшей живой клетки до миллионов различных видов живых существ, населяющих нашу планету, среди которых на пьедестале разума высится гомо сапиенс.

Остается только поклониться этой неутомимой системе наследственной связи, которая столь долго и столь надежно в отличие от рукотворных систем передачи информации служит и совершенствует все живое.

Что же такое информация?

Многие слова, подобно живым существам, рождаются, развиваются, видоизменяют свою форму, содержание и, случается, вовсе исчезают из языка. Взглянем с этих позиций на слово. ИНФОРМАЦИЯ. Появилось оно около двух с половиной тысяч лет назад в латинском языке. Затем проникло в большинство других языков.

Этим словом уже пользовался Марк Цицерон, произнося в Риме свои знаменитые речи против Каталины. Миллионы последующих поколений людей вплоть до середины нашего столетия продолжали его употреблять. Все они вкладывали в него приблизительно одинаковый смысл: сообщение, осведомляющее о положении дел, о состоянии чего-нибудь. Тысячелетиями слово ИНФОРМАЦИЯ было рядовым, ничем не выдающимся среди десятков тысяч других.

Все это долгое время человек считал себя единственным созданием, способным к передаче, приему и творению информации.

И вдруг новая наука опровергла эту единственность. Имя ее – кибернетика. Она открыла глаза людям на то, что сейчас известно почти каждому. Тогда это было сенсацией. Оказывается, информационные процессы происходят в любом живом организме, начиная с амебы и вируса. Прекратите обмен информацией червячка со средой, и он быстро погибнет. Появился афоризм глубокого смысла «Жизнь – это информация!».

Но это еще не все. В созданных человеком машинах мы опять-таки наталкиваемся на информационные процессы, без которых они не могут работать. Особенно ярко это проявилось в электронно-вычислительных машинах. Они не только потребляют информацию, но, как это было ни удивительно поначалу, могут творить свою, новую!

Наконец, любое сообщество живых существ – муравьев, пчел, птиц, рыб и, конечно, людей – не может существовать без потоков информации, циркулирующих в нем.

– И эти потоки информации у муравьев и людей однотипны?

– Во всех этих сообществах информация используется для управления. Надеюсь, вы наблюдали и удивлялись, как каждая особь в стайке рыб одновременно и удивительно синхронно меняет курс движения, как по единой команде стартует группа воробышков при приближении опасности Потоки информации в нашем обществе неизмеримо сложнее, имеют иную природу, но служат тем же целям – управлению. Это уже социальная информация – политическая, научно-технологическая, экономическая. В муравейнике циркулирует только биологическая информация.

А вот второе фундаментальное положение, установленное кибернетикой. Процессы управления – в отдельно взятом живом организме, в их сообществе, в машинах – принципиально не могут осуществляться без обратной связи. На «командный пункт» должна поступать тем или иным путем информация о состоянии управляемого объекта, окружающей среды и о выполнении посланных команд.

Вскрытие такого единства процессов в живом и неживом, широкое внедрение ЭВМ, стремительное нарастание потока газет, журналов, книг придало совершенно другое, широкое значение слову ИНФОРМАЦИЯ. Жизнь требовала раскрытия нового глубокого смысла этого звукосочетания из десяти букв.

Необходимо было научиться как-то оценивать информацию, измерять ее.

Но как ее измеришь одной мерой? Ведь передача информации – это сообщение любых сведений: о погоде, о настроении, об аварии на заводе, о восстании народа... Американский ученый Клод Шеннон взглянул на все виды информации с совершенно новой, единой позиции. Ведь информация несет уменьшение неопределенности в наших знаниях. Мы уже на примерах доказывали это. Значит, процесс передачи информации можно рассматривать как процесс уменьшения неопределенности.

Принимая решение ДА или НЕТ, мы уменьшаем неопределенность ситуации в два раза. Если вероятности ДА и НЕТ равны, то наше решение содержит ровно один бит информации. Ситуация, наблюдаемая при бросании монеты. Если она негнутая и неподпиленная, то вероятности выпадения орла и решки равны и составляют 0,5 при многократном бросании монеты. Кстати, один математик почти полжизни бросал монету, проверяя, по какому закону с увеличением числа опытов мы приближаемся к величине 0,5.

Если вероятности ДА и НЕТ различны, то картина меняется. Покажем это на примере. Для этого мысленно перенесемся в обычную сберегательную кассу. Допустим, вы проверяете, не выиграл ли ваш лотерейный билет автомашину «Волга». Всего продано 10 000 000 билетов. Выигрыш такой только один. Скользите глазами по таблице и своему билету. Все НЕТ, НЕТ, НЕТ... Знаете, что шанс мизерный, но надежда все еще теплится. Постепенно она тает, тает, тает... Становится скучно, глаза слипаются, вы теряете столбец... И вдруг все озарилось яркой вспышкой. Ура! Наконец, ДА! Вы подпрыгиваете почти до потолка.

Все это сделало одно ДА. Но это ДА, запрятанное среди 9 999 999 НЕТ. Очень неожиданное ДА. Его вероятность уже не равна вероятности НЕТ, а в 10 миллионов раз меньше! Поэтому оно принесло огромную информацию. Для обладателя счастливого билета это даже локальный информационный взрыв.

Клод Шеннон доказал, что количественная оценка информации, которую несет один символ – ДА, НЕТ, буква, цифра, – требует учета неожиданности его появления, то есть его вероятности.

Чем реже появляется символ или чем реже происходит некое событие, тем меньше его вероятность P и тем больше оно несет нам информации U.

Количественно зависимость выглядит так (прошу читателя поверить без доказательства U = log 1 / P.

В нашей лотерее количество информации в единственном ДА составит огромную величину

Uда = log 1/(1/9 999 999) = log 9 999 999 ≈ log 223 ≈ 23 бит.

Вот почему очень редкие неожиданные события врезаются в память на всю жизнь. Создаваемая ими информация столь велика, что она поражает наше сознание, и мозг надежно фиксирует их.

В подобных случаях наш скромный элементарный носитель информации – ДА или НЕТ, «+» или «–», «1» или «0» – может стать миллиардером. Ведь если вероятность события стремится к нулю (P → 0), то сообщаемая им информация (если оно происходит) стремится к бесконечности (U → ∞).

– Значит, своего корреспондента надо бомбить очень редкими, неожиданными сообщениями. Тогда каждое из них будет очень богато информацией, а суммарный поток сведений будет максимальным. Так?

– Нет, совсем не так! В нашем примере единственный символ ДА содержал огромную информацию в 23 бита, но остальные 9 999 999 символов НЕТ несли ничтожную информацию.

В самом деле.

Uнет = log 9 999 999/10 000 000 ≈ 0 бит.

Следовательно, в среднем каждый символ в нашей лотерейной таблице переносил ничтожную информацию

Uср = 23/10 000 000 = 0,0 000 023 бит.

Если же мы будем передавать посылки ДА-НЕТ с равными вероятностями, то есть Рда = Рнет = 0,5, то каждый символ будет нести информацию ровно в один бит.

Следовательно, наши 10 000 000 символов сообщат информацию, равную 10 000 000 битам.

Поэтому для передачи максимального количества информации надо применять символы близкой или равной вероятности. В нашей лотерее этого, естественно, сделать нельзя, так как при Pда = Pнет = 0,5 пришлось бы разыгрывать не одну машину, а 5 000 000. В системах связи, где важно передать максимальное количество информации в: единицу времени, наилучший режим при одинаково частом следовании сигналов ДА и НЕТ.

– С ДА и НЕТ ясно. А если сообщение определяет выбор не из двух, а из трех, четырех, ста возможностей, то его информация растет?

– Вы правы. Есть только два рычага для увеличения передаваемой информации. Первый мы уже разобрали. Он связан с вероятностью сообщения. Второй – это увеличение числа альтернатив или увеличение тех различных «кирпичиков», из которых набирается сообщение, увеличение многоликости символов.

И это одна из поразительных особенностей информации. Мы ее уже касались. Пусть сообщение набирается не из двух возможностей ДА-НЕТ, а из любого числа возможностей т. Например, русская письменная речь использует 32 буквы, выбор идет из 32 возможностей, то есть m = 32. Если все т альтернатив равновероятны, то информация растет пропорционально логарифму их числа: U = log m.

Равные по объему сообщения могут содержать различное количество информации. Чем больше ансамбль знаков, из которых составлено сообщение, тем больше в нем информации.

Кстати, в этом одно из объяснений всеобщей любви к стихам Пушкина. Он успешно пользовался этим законом, еще тогда не сформулированным, но, безусловно, существовавшим. Александр Сергеевич, слагая стихи, находил нужное слово из огромного запаса слов, которым он владел и хранил в памяти. Его словарь содержал более 30 тысяч слов. Поэтому его стихи очень информативны, рисуют тончайшие образы, дают удивительно тонкие оттенки мыслей и чувств, легко запоминаются.

Есть люди с очень бедным словарем. Даже длинная их устная или письменная речь несет очень мало информации.

Мы уже упоминали Людоедку Эллочку, обкорнавшую язык свой до узкого набора стандартных слов. Это известный литературный пример.

Проходя в перерыве между лекциями по коридору, иногда слышишь, как некоторые студенты, подражая Эллочке, щеголяют речью, состоящей только из ставших «модными» словечек и выражений – «балдеть», «ну ты даешь», «не возникай» и пр. Не хочется подсчитывать ту ничтожную информацию, которую они сообщают при этом своим собеседникам...

Давайте мысленно перенесемся на оживленный перекресток двух улиц. Если на нем нет светофора (так называемый нерегулируемый перекресток), то пересекающие его водители и пешеходы руководствуются в основном взаимной вежливостью и соблюдением приоритетов для некоторых видов транспорта. Такая ситуация нередко приводит к дорожным инцидентам. Давайте поставим на перекрестке простейший светофор с двоичным алфавитом (m = 2). Зеленый – ДА, красный – НЕТ. Безопасность движения, несомненно, повысится. Но переход от одного сигнала к другому происходит мгновенно, и это таит опасность. Ведь и автомашина, и даже человек не могут мгновенно остановиться, всегда есть некоторый тормозной путь. Кроме того, переключение светофора может застать на самом перекрестке.

Увеличим информацию, сообщаемую светофором: введем сигнал перехода от ДА к НЕТ и обратно. Его можно ввести двояко. Переходу от одного сигнала к другому всегда предшествует третий сигнал – желтый свет (m = 3). Это дает время на «очистку» перекрестка и торможение при приближении к нему. Можно сделать иначе. Применить четверичные сигналы (m = 4). Кроме красного и зеленого огней, ввести мигающий красный и мигающий зеленый. Начало мигания предупреждает о скором его выключении. Здесь можно пойти дальше – нормировать число миганий. Например, взять его равным пяти. Это позволит и пешеходам и водителям более точно оценивать время перехода от запрета к разрешению, и наоборот. Можно дополнить мигание звуковым сигналом. Например, диктор ведет приятным голосом счет миганиям.

Разобранные системы не обладают гибкостью, они работают по фиксированной программе. И уже появляются адаптивные системы, у которых управление зависит от ситуации на перекрестке. Если много машин и пешеходов в данном направлении, то ДА длится дольше, если мало – оно короче. Если, например, взять четыре разных интервала для каждого цвета, то наш алфавит с m = 4 превратится в более богатый алфавит с m = 4 · 4 = 16.

Информативность каждого сигнала станет еще больше, что повысит и безопасность и эффективность работы светофора.

Что же произойдет, если мы мысленно, представим себе ансамбль сигналов из бесконечного числа элементов, то есть будем считать m = ∞ Тогда из приведенной формулы следует, что информация, передаваемая одной, только одной посылкой, будет бесконечно велика, так как log m = ∞. Это, конечно, практически нереализуемая абстракция, но из нее следуют интересные выводы.

Так, если использовать полный набор иероглифов китайского языка, содержащий их около 40 000, то каждый знак несет огромную информацию, превышающую 15 бит. Практически сейчас в китайском языке используется около 3000 иероглифов. Это сразу вызывает уменьшение информационной насыщенности одного иероглифа до величины порядка 11 бит.

Возможность наполнения информацией каждого знака при увеличении алфавита позволяет производить сжатие информации во времени.

Мы уже приводили пример передачи на спутник 1000 команд. Было найдено, что при двоичном алфавите для сообщения одной команды требуется передать на спутник 10 посылок. Пусть, например, для исключения перехвата команд противником, требуется уменьшить время передачи одной команды в 10 раз. Ясно, что при использовании алфавита из 1000 знаков задача будет решена: каждая посылка будет сообщать одну из тысячи команд.

При этом, конечно, возникают трудности формирования большого алфавита на передаче и уверенного различения его знаков на приеме в присутствии помех. Но в ряде случаев решение находится.

– А как быть с содержанием информации? Ведь одно и то же число бит может нести очень важную и пустяковую информацию, полезную и бесполезную.

– Вы правы. Тем более что одна и та же и информация для одних очень важна, а другим безразлична.

Подход Клода Шеннона полностью игнорирует содержание информации. Ведь посылки ДА-НЕТ могут снять неопределенность в самых разных случаях: объявлять войну соседнему государству или нет, выходить замуж за Мишу или за Гришу, пить чай с молоком или со сливками, идти спать или смотреть телевизор...

Было сделано несколько попыток найти меру содержательности информации для ее получателя.

Так, советский математик Ю. Шрейдер продолжал ее оценивать по увеличению знаний данного индивида в любой области.

Академик А.А. Харкевич предложил измерять содержательность информации по увеличению вероятности достижения цели после получения информации субъектом или машиной.

Но оба этих остроумных подхода пока не настолько разработаны, чтобы решить сложнейшую задачу количественной оценки смыслового, или, как говорят специалисты, семантического, значения полученной потребителем информации.

– Выходит, что пока единственный способ измерения любой информации очень примитивен: превращаем ее в посылки типа ДА-НЕТ и считаем их число, невзирая на смысл и важность содержания. Ведь так?

– К сожалению, почти так. При этом только надо не забыть учесть вероятности, с которыми следуют эти самые ДА-НЕТ.

– Но что же такое есть сама информация? Что это за субстанция? Сколько можно уклоняться от ответа на этот вопрос?

– Загадка информации не давала покоя не только физикам, математикам, инженерам, но отнимала сон и у философов. Ведь они давно установили, что основа всего сущего есть движущаяся материя и энергия, являющаяся общей мерой различных форм движения материи (механической, тепловой, электромагнитной, ядерной...). Куда же отнести информацию? Она и не материя, и не энергия.

– Но ведь для переноса информации нужен распространяющийся в пространстве носитель, создание которого требует затраты энергии.

– Верно. Энергия действительно затрачивается, но тут она играет вспомогательную, третьестепенную роль.

В итоге философские раздумья и горячие дискуссии привели к новому возвеличиванию слова ИНФОРМАЦИЯ. Оно заняло достойное место среди двух гигантов МАТЕРИИ и ЭНЕРГИИ.

Более того, определить, что есть любая разумная цивилизация, на уровне наших сегодняшних знаний невозможно без слова «информация». Цитирую определение, данное членом-корреспондентом АН СССР В.С. Троицким:

«Цивилизация – это общность разумных существ, использующих обмен информации, энергии и массы для выработки действий и средств, поддерживающих свою жизнь и прогрессивное развитие».

Не случайно в этом определении слово «информация» стоит на первом месте. В тексте цитированной работы В. Троицкий поясняет, что, кроме обмена информацией отдельными индивидуумами цивилизации, очень важным является обмен информацией, вырабатываемой всей цивилизацией с внешней средой. Он осуществляется трудом, экспериментом, наукой и техникой, то есть производительной силой цивилизации.

Теперь вернемся к определению самого понятия «информация». Прежде всего отметим, что природа информации, в том числе и возможность измерения ее ценности, является предметом дальнейшего ее изучения. Вместе с тем стало ясно, что источником всей информации является окружающий нас материальный мир. На этом основании наиболее распространенным определением является такое: ИНФОРМАЦИЯ – это отражение того разнообразия, которое существует во Вселенной. Поясним его на примерах.

Представим себе, что мироздание заполнено однообразным, совершенно одинаковым веществом. И только им. Никакого разнообразия.

Я вспоминаю, как нам приходилось искать путь в бескрайних снежных полях Тянь-Шаня в полном тумане и без компаса. Никаких ориентиров. Никакой нужной нам информации. Никакого разнообразия. Казалось, вся Вселенная заполнена этим молоком.

Если бы окружающий нас мир имел только два качества, например состоял из света и тьмы, то он обладал бы минимально возможным разнообразием. Но к нашему счастью, мир настолько разнообразен, что отражаемая, можно даже сказать передаваемая, им информация бесконечно разнообразна.

– Вы утверждаете, что мертвая материя при наличии разнообразия передает информацию. Как же это понимать?

– Именно так. Поскольку разнообразие присуще всем предметам и явлениям, то информация всем им присуща. При этом, конечно, в неживой природе эта информация только хранится и передается. Неживая материя не может использовать ее для управления. Таких процессов нет в неживой материи. Но это разнообразие окружающего нас мира, эту передаваемую всем сущим информацию, хотя бы частично, воспринимают живые существа, человек и, конечно, созданные им различные приборы.

В самом деле, изучая ту или иную звезду, мы просто используем информацию, которую она шлет о себе всем, всем, всем. А просторы Вселенной при этом играют роль памяти, которой может позавидовать любая ЭВМ. Звезда может умереть, взорваться, погаснуть. Но излученная ею информация еще миллионы и миллиарды лет может двигаться в этой вселенской памяти к возможным получателям.

Сколько, например, информации принесла находка трехлетнего мамонта в вечной мерзлоте Сибири? Это был небольшой информационный взрыв. У него в желудке даже сохранились остатки пищи!

Системы связи, которыми мы пользуемся, тоже можно рассматривать с позиций разнообразия.

Если источник информации, например телеграфный аппарат, работает сигналами 1 и 0, то разнообразие его минимально, оно равно двум.

Если аппарат способен передавать все десятичные цифры – 0, 1, 2, 3... 9, – то его разнообразие равно десяти и он более информативен.

Если источник информации испортился и все время передает только один из символов – ДА, НЕТ, цифру, букву, то разнообразия никакого нет. Следовательно, и нет передачи информации.

Таким образом, информация есть отражение разнообразия, существующего в материальном мире. Нет разнообразия, нет и информации.

Передавая тем или иным способом информацию своему корреспонденту, мы тем самым сообщаем ему частичку этого наблюдаемого нами в окружающем мире или в себе разнообразия. Если оно уже известно получателю сообщения, то никакой информации он не получит. Ее неожиданность будет точно равна нулю.

Информация из окружающего мира передается человеку с помощью разнообразных носителей. Оказалось, что все эти системы передачи информации подчиняются некоторым общим закономерностям, о которых идет беседа в следующем разделе. Они помогут нам лучше представить общую картину информационных потоков в современном мире.

 

A и Z обмениваются информацией

Оглавление

 

Дата публикации:

4 августа 2001 года

Текст издания:

Петрович Николай Тимофеевич. Люди и биты. Информационный взрыв: что он несет. М.: Знание, 1986.

Дата обновления:

16 декабря 2010 года

Электронная версия:

© НиТ. Раритетные издания, 1998



В начало сайта | Книги | Статьи | Журналы | Нобелевские лауреаты | Издания НиТ | Подписка
Карта сайта | Cовместные проекты | Журнал «Сумбур» | Игумен Валериан | Техническая библиотека
© МОО «Наука и техника», 1997...2014
Об организацииАудиторияСвязаться с намиРазместить рекламуПравовая информация
Яндекс цитирования