Перейти в начало сайта Перейти в начало сайта
Электронная библиотека «Наука и техника»
n-t.ru: Наука и техника
Начало сайта / Совместные проекты / ЛЭСМИ
Начало сайта / Совместные проекты / ЛЭСМИ

Научные статьи

Физика звёзд

Физика микромира

Журналы

Природа

Наука и жизнь

Природа и люди

Техника – молодёжи

Нобелевские лауреаты

Премия по физике

Премия по химии

Премия по литературе

Премия по медицине

Премия по экономике

Премия мира

Книги

В поисках «энергетической капсулы»

Загадки простой воды

Люди и биты. Информационный взрыв: что он несет

Парадоксы науки

Ум хорошо...

Химия вокруг нас

Издания НиТ

Батарейки и аккумуляторы

Охранные системы

Источники энергии

Свет и тепло

Научно-популярные статьи

Наука сегодня

Научные гипотезы

Теория относительности

История науки

Научные развлечения

Техника сегодня

История техники

Измерения в технике

Источники энергии

Наука и религия

Мир, в котором мы живём

Лит. творчество ученых

Человек и общество

Образование

Разное

Системное оптимальное планирование регрессионного эксперимента

Радченко Станислав Григорьевич, д.т.н., профессор
Национальный технический университет Украины

Полная версия статьи: PDF; DOC

УДК 519.242.5:519.233.5

Постановка проблемы

Классическая теория планирования эксперимента для построения статистических моделей, линейных по параметрам и, в общем случае, нелинейных по факторам, разработала методологию постановки многофакторных экспериментов в предположении, что структура модели и критерии ее оптимальности заданы. План эксперимента конструируется в соответствии с этой информацией. Практика решения прикладных задач по новым мало изученным техническим и технологическим системам показала, что структура модели часто исследователю не известна. Постулирование структуры модели не гарантирует успешное решение задачи. Необходимо разработать методы выбора плана эксперимента и получения структуры модели с гарантированным обеспечением ее адекватности, устойчивости, статистической эффективности, семантичности. Выполнение указанных критериев для получаемых моделей будем определять как системное оптимальное планирование эксперимента. В доступных публикациях такое решение проблемы не известно.

Анализ публикаций по теме исследований

Авторы учебного пособия [1, с. 9] отмечает, что «...задача аппроксимации эмпирических зависимостей как на компьютере, так и без него, начиная с ее постановки, во многих отношениях строго не решается, остается неопределенной и неоднозначной».

Д.т.н. Налимов В.В., к.т.н. Голикова Т.И. подчеркивают, что матрица независимых переменных Х появляется только после того, как модель задана [2, с. 31].

Д.т.н. Новицкий П.В., к.т.н. Зограф И.А. обращают внимание на то, что планирование эксперимента возможно только после установления вида математической модели исследуемого явления [3, с. 277].

В работе [2, с. 120] поставлена задача получения робастных планов экспериментов, «...т. е. планов малочувствительных к возможному изменению моделей хотя бы в пределах некоторого их класса». Однако поставленная задача не была решена.

В работе [4, с. 184] отмечается, что план эксперимента, будучи оптимальным для определенной модели, может оказаться «наихудшим из возможных», если модель в действительности окажется иной.

Помимо выбора устойчивого (робастного) плана эксперимента, т. е. плана, позволяющего устойчиво выделять различные структуры моделей, необходимо разработать общий метод получения устойчивых структур, не известных исследователю для конкретно решаемой задачи.

К.т.н. Адлер Ю.П. считает, что «никакие изощрения не позволяют получить единственный и однозначный ответ» при определении уравнения регрессии по предложенным исходным данным. «Автоматизация задач регрессионного анализа зашла в тупик» [5, с. 5-6]. При рассмотрении разнообразных шаговых и комбинированных методов регрессионного анализа не формулируются конкретные алгоритмы выделения структур уравнения регрессии, а предлагается более 11 процедур, «состоящих в последовательном добавлении к регрессии или, наоборот, удалении из нее отдельных носителей» [5, с. 125...131, 142...143]. Обращается внимание на «проблему коллинеарности» в регрессионных задачах.

В работе [6, с. 22, 175...176] отмечается, что «не существует стандартных приемов и методов, которые образовывали бы строгую теоретическую базу для решения этой важнейшей задачи» – «задачи правильного определения структуры модели».

Авторы книги [7, с. 255] «отмечают важность выбора такой функции регрессии, чтобы она имела «физический смысл, т. е. открывала какую-то объективную закономерность... Поэтому выбор типа регрессионной зависимости является самой острой проблемой в любом исследовании».

Аналогичные суждения высказываются и в других публикациях по статистическим методам исследования.

Другая важная проблема связана с разработкой метода устойчивого оценивания статистических моделей в условиях мультиколлинеарности факторов.

Цель статьи

Изложение методов получения устойчивых структур моделей, не известных исследователю, и устойчивых многофакторных планов экспериментов, которые обеспечивают комплекс необходимых критериев качества многофакторных регрессионных моделей.

Основная часть

Сформулируем основные критерии, которым должны соответствовать структура статистической модели и многофакторный план эксперимента.

Структура статистической модели, линейной по параметрам и, в общем случае, нелинейной по факторам должна соответствовать следующим требованиям.

  1. Структурная группа коэффициентов многофакторного уравнения регрессии не известна исследователю. Задание исследователем структуры уравнения регрессии, в общем случае, будет ошибочной по причине сложности, новизны, эмергентности (несводимости свойств системы к сумме свойств ее отдельных подсистем) систем.
  2. Структуры моделей выбираются из структуры модели полного факторного эксперимента с ортогональными или близкими к ортогональным структурными эффектами. Иное множество эффектов, в общем случае, не образует достаточное множество совместно ортогональных эффектов и, следовательно, получаемая модель будет не адекватной и не устойчивой.
  3. Выбор структуры модели должен быть формализованным. В противном случае исследователь будет вынужден использовать метод проб и ошибок, что не гарантирует получение адекватной модели.
  4. Возможность формализованного отображения в математической модели произвольной (но конечной) по сложности реальной действительности при условии правильного выбора степени полинома по каждому фактору. Необходимо выбрать множество главных эффектов и их взаимодействий со свойствами семантичности, т. е. интерпретации коэффициентов в терминах предметной (моделируемой) области знаний.
  5. Доступность, простота и надежность фактического получения адекватной структуры при решении задач на потоке. Выполнение такого требования возможно при использовании соответствующего программного обеспечения, которое реализует новую технологию регрессионного анализа.

Многофакторный план эксперимента должен соответствовать следующим критериям:

  1. Обеспечение соответствия эффектов модели критерию ортогональности или (для случая дробного факторного эксперимента) близости к нему. Невыполнение этого требования приводит, в общем случае, к получению неадекватных и неустойчивых моделей, а коэффициенты моделей будут смещенные.
  2. Соответствие плана эксперимента критериям D-, A-, E-, G-, Q-оптимальности. Не выполнение критериев приведет к получению не эффективных в статистическом смысле моделей.
  3. План эксперимента должен обеспечивать за счет ортогональности и нормирования эффектов максимально возможную устойчивость коэффициентов модели cond(X TX) = 1. При невыполнении – структура модели не будет соответствовать «истинной» (правильной) и она будет неустойчивой.
  4. При ортогональности эффектов получаем наилучшие условия для случаев перебора (введение большего, чем надо, числа эффектов) и недобора эффектов по отношению к «истинной» структуре модели по критериям несмещенности, состоятельности и статистической эффективности определяемых коэффициентов. При невыполнении – полученная модель не будет соответствовать приведенным критериям.
  5. При ортогональности всех эффектов обеспечивается адекватность или близость к ней полученных моделей в реализованных точках плана эксперимента. При невыполнении этого условия модель будет давать ошибочные значения критерия качества моделируемой системы (отклика).
  6. Возможность использования плана эксперимента для количественных и качественных факторов. Многофакторные регулярные планы позволяют описывать влияние количественных и качественных факторов.
  7. Возможность последовательного планирования для дробного факторного эксперимента. При выполнении условия возможно адекватное описание критерия качества при минимальном числе опытов или, при необходимости, переходе к большему числу опытов с сохранением начального плана или его расширением.
  8. Разбиение плана эксперимента, при необходимости, на произвольное число ортогональных блоков. При невыполнении условия дисперсия воспроизводимости может быть значительной и некоторые эффекты модели будут статистически незначимы.
  9. Полный факторный эксперимент и многофакторные регулярные планы позволяют выделять различные структуры статистических моделей ŷw (w – текущий номер определяемой модели, 1 ≤ w ≤ m; m – общее число определяемых по плану эксперимента моделей) по одному плану эксперимента. При невыполнении условия необходимо использовать несколько планов, что увеличивает затраты на исследование.

Далее раздел «Основная часть» см. в полной версии статьи: PDF; DOC

Программное обеспечение решения задач

На кафедре технологии машиностроения Национального технического университета Украины «Киевский политехнический институт» разработано программное средство «Планирование, регрессия и анализ моделей» (ПС ПРИАМ) [9, с. 45...47]. Оно предназначено для выполнения комплекса работ, связанных с генерацией многофакторных планов для оптимизации и моделирования, обработки их результатов, проведения вычислительного эксперимента, визуализации полученных результатов.

ПС ПРИАМ характеризуется следующими функциями.

  1. Реализация специально разработанной технологии решения научных и прикладных задач по построению статистических регрессионных моделей и многокритериальной оптимизации.
  2. Построение робастных (устойчивых) планов эксперимента.
  3. Эффективные алгоритмы определения структуры уравнения регрессии (алгоритмы RASTA3 и др.).
  4. Устойчивое оценивание коррелированных факторов в многофакторном уравнении регрессии (алгоритмы RASTA4, RASTA5.1 и др.).
  5. Ориентация на массового пользователя. ПС содержит все необходимые средства для решения задач от ее постановки до получения отчета.

Изложенное системное оптимальное планирование эксперимента использовалось при получении статистических регрессионных моделей технических, технологических, измерительных, материаловедческих и других систем [10, с. 102...115]. Его применение возможно при решении конструкторских, технологических, испытательных, эксплуатационных задач, в научно-исследовательской работе, в учебном процессе.

Системное оптимальное планирование эксперимента было проверено при решениях более ста прикладных системных задач и показало хорошие результаты.

В исследовании [11] для трех типов полиэтиленовых труб – тяжелой (Т), средней (С) и среднелегкой (СЛ) были смоделированы и оптимизированы технологические условия сварки: температура нагревательного инструмента (tн), время оплавления свариваемых торцов (tопл), давление осадки труб (Рос). Результаты сварки характеризовались шестью критериями качества (разрушающее напряжение при растяжении, высота и ширина грата в зоне сварки, составляющая вязкого разрушения при изломе образца и др.). Использовался многофакторный регулярный план 31×43//32 [9, с. 333]. С применением ПС ПРИАМ по результатам эксперимента построены статистические модели ŷ1... ŷ6 и проведен их анализ. Разработанные по моделям оптимальные условия сварки были внедрены в четырех химических трестах строительного производства. Фактический народнохозяйственный эффект за 1985...1987 г. составил 896 398 руб.

С целью определения оптимальных и предельных условий эксплуатации, обоснованного выбора материалов термонапряженной изоляции (ТНИ) высоковольтного трансформаторно-выпрямительного модуля было проведено исследование влияния 9 простых факторов, сведенным к 4 обобщенным (Х1 – электрофизический, Х2 – геометрический, Х3 – теплоотвода в окружающую среду, Х4 – теплофизический) на 9 критериев качества у1...у9, характеризующих запас электрической прочности, напряженность электрического поля и температуру диэлектрика в различных точках ТНИ в нестационарном режиме [12]. Использовался равномерный многофакторный регулярный план 34//27 (четыре фактора, каждый фактор изменялся на трех уровнях, 27 опытов). Были получены статистические модели для 9 критериев качества ТНИ, по моделям был проведен вычислительный эксперимент и найдены оптимальные значения факторов для различных сочетаний критериев качества.

В работе [13] было проведено повышение точности измерения цифровых весов путем моделирования влияния на показание датчика весов у четырех факторов, (Х1 – гистерезис, Х2 – температура окружающей среды, Х3 – напряжение питания, Х4 – измеряемый вес), из которых первые три создают переменные систематические погрешности, с последующим исключением влияния этих погрешностей с использованием полученной модели. По результатам полного факторного эксперимента 21×32×61//108 построена адекватная, информативная, максимально устойчивая модель ŷ, с использованием которой точность измерений по критерию среднее абсолютных величин относительных погрешностей аппроксимации |ēuотн| была повышена в 13,3 раза и по критерию среднеквадратичной погрешности аппроксимации в 11,2 раза.

Изложенная система оптимального планирования эксперимента предполагает, что форма факторного пространства соответствует классической: планированию на кубе, сфере, симплексе. Если форма факторного пространства иная, то необходимо использовать разработанные методы топологического отображения области хорошо обусловленного факторного пространства – прообраза – в область плохо обусловленного пространства – образ [9, с. 183...300], что позволяет устойчиво решать некорректно поставленные задачи.

Выводы и перспективы дальнейших исследований

  1. Впервые сформулированы системные требования к плану эксперимента, обеспечивающие, в общем случае, наилучшие системные свойства статистических моделей.
  2. Впервые приведен общий вид структуры многофакторной статистической модели, позволяющий получить адекватные, семантические (в информационном смысле), устойчивые модели, структуры которых заранее исследователю не известны.
  3. Показано, что сформулированные требования к плану эксперимента и структуре моделей выполняются для полных факторных экспериментов, многофакторных регулярных планов и планов на основе ЛПτ равномерно распределенных последовательностей.

Разработанное системное оптимальное планирование эксперимента обеспечивает выбор плана и получение структуры модели, не известной исследователю заранее, подтвердило эффективность при решении более ста прикладных системных задач по техническим, технологическим, измерительным и др. системам.

Дальнейшее развитие изложенного подхода проводится с использованием топологического метода устойчивого оценивания регрессионных моделей при решении некорректно поставленных задач [14; 15, с. 288...289].

Список литературы

  1. Компьютерный анализ и интерпретация эмпирических зависимостей / С.В. Поршнев, Е.В. Овечкина, М.В. Мащенко, А.В. Каплан и др. Учебник. – М.: ООО «Бином-Пресс», 2009. – 336 с.
  2. Налимов В.В., Голикова Т.И. Логические основания планирования эксперимента. – 2-е изд., перераб. и доп. – М.: Металлургия, 1981. – 152 с.
  3. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. – 2-е изд., перераб. и доп. – Л.: Энергоатомиздат. Ленингр. отд-ние, 1991. – 304 с.
  4. Себер Дж. Линейный регрессионный анализ / Пер. с англ. В.П. Носко; Под. ред. М.Б. Малютова. – М.: Мир, 1980. – 456 с.
  5. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия: В 2-х вып. Вып. 2 / Пер. с англ. Б.Л. Розовского; Под ред. и с предисл. Ю.П. Адлера. – М.: Финансы и статистика, 1982. – 239 с.
  6. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследования зависимостей: Справ. изд. / Под. ред. С.А. Айвазяна. – М.: Финансы и статистика, 1985. – 487 с.
  7. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере / Под ред. В.Э. Фигурнова. – М.: ИНФРА–М, 1998. – 528 с.
  8. Бродский В.З. Введение в факторное планирование эксперимента. – М.: Наука, 1976. – 224 с.
  9. Радченко С.Г. Устойчивые методы оценивания статистических моделей: Монография.  – К.: ПП «Санспарель», 2005. – 504 с.
  10. Радченко С.Г. Анализ экспериментальных данных на основе использования многофакторных статистических математических моделей // Математичні машини і системи. – 2005. – № 3. – С. 102...115.
  11. Оптимизация технологических условий сварки полиэтиленовых труб / С.Г. Радченко, Ю.С. Бурбело, Э.В. Котенко, С.Н. Лапач и др. // Пласт. массы. – 1988. – № 9. – С. 29...31.
  12. Многофакторная математическая модель термонапряженной электроизоляции / М.Е. Иерусалимов, С.А. Соколовский, С.Г. Радченко и др. // Электричество. – 1991. – № 8. – С. 40...45.
  13. Радченко С.Г., Бабич П.Н. Информационная коррекция переменных систематических погрешностей средств измерений и измерительных информационных систем // Радиоэлектроника и информатика. – 1999. – № 3. – С. 82...88.
  14. Лаборатория экспериментально-статистических методов исследований.
  15. Радченко С.Г. Методология регрессионного анализа: монография. – К.: «Корнійчук», 2011. – 376 с.

Ранее опубликовано:

Радченко С.Г. Системное оптимальное планирование регрессионного эксперимента / С.Г. Радченко // Заводская лаборатория. Диагностика материалов. – 2012. – Т. 78, № 7. – С. 71...75.

Дата публикации:

28 июля 2013 года

Электронная версия:

© НиТ. Совместные проекты, 1998

В начало сайта | Книги | Статьи | Журналы | Нобелевские лауреаты | Издания НиТ | Подписка
Карта сайта | Cовместные проекты | Журнал «Сумбур» | Игумен Валериан | Техническая библиотека
© МОО «Наука и техника», 1997...2017
Об организацииАудиторияСвязаться с намиРазместить рекламуПравовая информация
Яндекс цитирования
Яндекс.Метрика