Перейти в начало сайта Перейти в начало сайта
Электронная библиотека «Наука и техника»
n-t.ru: Наука и техника
Начало сайта / Раритетные издания / Биологически активные
Начало сайта / Раритетные издания / Биологически активные

Научные статьи

Физика звёзд

Физика микромира

Журналы

Природа

Наука и жизнь

Природа и люди

Техника – молодёжи

Нобелевские лауреаты

Премия по физике

Премия по химии

Премия по литературе

Премия по медицине

Премия по экономике

Премия мира

Книги

Архимед

Загадки простой воды

Культура. Техника. Образование

Плеяда великих медиков

Приключения великих уравнений

Химия вокруг нас

Издания НиТ

Батарейки и аккумуляторы

Охранные системы

Источники энергии

Свет и тепло

Научно-популярные статьи

Наука сегодня

Научные гипотезы

Теория относительности

История науки

Научные развлечения

Техника сегодня

История техники

Измерения в технике

Источники энергии

Наука и религия

Мир, в котором мы живём

Лит. творчество ученых

Человек и общество

Образование

Разное

Биологически активные

Станислав Галактионов

Непосредственная связь с магией

Не счесть всех постыдных поражений и глупейших конфузов, кошмарных провалов и опереточных таки ошибок, выпавших на долю тех мужественных и изобретательных людей, которые впервые взялись за внедрение методов теории распознавания образов в различных прикладных областях.

Социология, лингвистика, экономика, геология, ботаника – где только не пробовали они свои силы; как мы знаем, в фармакологии и токсикологии тоже. Их приход в каждую из этих областей встречался сначала с большим энтузиазмом, затем следовали первые результаты – и они решительно всех разочаровывали. ЭВМ, напичканная массой всяческой информации и снабженная программами, в которых реализовались мудреные алгоритмы, с трудом отличала, образно говоря, зайца от барашка (есть абхазская пословица: «Похож, как заяц на барашка») и уж полностью была бессильна в ситуациях менее очевидных, хотя все еще тривиальных с точки зрения специалистов. В шестидесятые годы, когда происходило становление теории распознавания образов, часто с эстрады звучала басня о некоем незадачливом руководящем Медведе, привыкшем подбирать кадры исключительно на основании анкеты:

...Рассмотрим данные, картина такова:
Ноги четыре, уха два,
Шерсть тона светлого, длинней всего на холке.
Имеет хвост, украшенный метелкой,
Способен оглушительно реветь...
«Так это ж лев!» – разинул рот медведь.

При ближайшем рассмотрении обладатель анкеты оказался ослом. В этой истории, как в капле воды, отражены неприятности, подстерегающие авторов распознающих программ; в частности, сразу бросается в глаза использование малоинформативных признаков: «ноги четыре» и в особенности «уха два».

За прошедшие с тех пор два с лишним десятилетия теория распознавания образов значительно шагнула вперед, и во многих сферах использование ее методов для решения различных прикладных задач стало повседневной практикой. К сожалению, этого нельзя пока сказать о задачах выявления связи структура – активность, хотя и на этом пути достигнут определенный прогресс.

Один из важнейших уроков истории развития методов теории распознавания образов заключается, по-видимому, в выводе, что нет надежд на получение универсальных, пригодных в равной степени для всех задач методов; каждый узкий класс задач требует создания строго ориентированных процедур, учитывающих специфику задачи. Даже при исследовании проблемы связи структура – активность наметилось несколько направлений, требующих развития различных подходов в зависимости от поставленных целей и круга изучаемых соединений; при этом именно в силу специфики задачи некоторые из них выходят за традиционные рамки методов теории распознавания образов.

Рассмотрим подробнее в качестве примера так называемый логико-структурный подход к изучению связи структура – активность, развиваемый упоминавшимся А.Б. Розенблитом и В.Е. Голендером.

Сами авторы объясняют отличие своего подхода от традиционных методов теории распознавания образов следующими словами: «При исследовании проблемы связи структура – активность методы распознавания образов представляются нам недостаточными потому, что основная их цель – найти решающее правило классификации объектов. Для нас же не только важно найти решающее правило, с помощью которого можно было отнести данное соединение к определенному виду (или нескольким видам) активности, но. не менее важно на основе обучающей последовательности выявить структурные признаки, руководствуясь которыми химик мог бы синтезировать новые соединения с наперед заданной активностью. Разумеется, важно иметь оценку достоверности признака».

Очевидно, при таком подходе сохраняется и необходимость создания специального языка для описания химической структуры соединений, и использование некоторой классификации типов их биологической активности с учетом того обстоятельства, что возможна принадлежность соединения к двум или нескольким классам сразу, то есть допускается наличие у него нескольких типов биологической активности. Наконец, необходима разработка соответствующим образом организованных банков данных.

Для демонстрации сути приема, лежащего в основе алгоритма отбора признаков, характерных для определенного типа биологической активности, авторы рассматривают простейший пример группы соединений, принадлежащих одному ряду и различающихся лишь характером заместителей в четырех положениях. Можно для определенности взять некоторое циклическое ядро или фрагмент алифатической цепочки с заместителями R1, R2, R3, R4. Например:

Эти заместители могут быть радикалами –NH2, –CH3, –C2H5, –C6H5, –H, –F, –Br, –NO2 и др. в различных комбинациях.

Все соединения разделены на две группы, обладающие определенным видом биологической активности и лишенные ее. Будем попарно сопоставлять представителей каждой группы, отмечая всякий раз совпадения и несовпадения характера заместителей в отдельных положениях. В результате выяснится, что, скажем, комбинации R1 = –H, R3 = –Br и R1 = –CH3, R2 = –NH2 наблюдаются только у активных соединений, комбинации R1 = –H1, R4 = –NO2 и R1 = –CH3, R2 = –C6H5 – только у неактивных. Помимо этого, есть и признаки, встречающиеся у представителей обеих групп. Можно подсчитать и частоту наблюдения различных совокупностей заместителей в двух группах и на этой основе получить простое решающее правило, приняв некоторое ее пороговое значение, превышение которого указывает на активность.

Обнаружив у анализируемого соединения признаки, характерные для группы активных веществ, а это могут быть, в принципе, любые сочетания пар, троек и т.д. заместителей, мы вправе предположить, что и оно будет обладать соответствующей активностью. Аналогично может быть сделано заключение о его неактивности. Возможны, разумеется, случаи, когда выраженные признаки, характерные для соединений первой или второй группы, отсутствуют; здесь придется воздержаться от предсказания.

Все действительно логично («логико-структурный подход»!) и как будто очень просто. Просто, однако, только в случае рассмотренного игрушечного примера. Для реализации этого подхода применительно к задачам, представляющим реальный интерес, потребовалось создание весьма сложных систем. Одну из таких систем авторы ее нарекли ОРАКУЛ (Оптимизированный Распознающий Алгоритм Конструирования Усовершенствованных Лекарств). Главе, в которой содержится ее описание, они предпослали в качестве эпиграфа утверждение авторитетнейшей Британской энциклопедии: «Все, относящееся к оракулам, непосредственно связано с магией».

 

Несколько необычные конструкторы

Оглавление

 

Дата публикации:

10 ноября 2001 года

Электронная версия:

© НиТ. Раритетные издания, 1998