microbik.ru
  1 2 3 ... 7 8
Глава 2. Корректность решений и традиционные методы ее проверки
§1. Вариации коэффициентов и параметров
В дальнейшем мы будем изучать поведение различных объектов техники, физики, экономики при изменениях их параметров и будем изучать поведение математических моделей исследуемых объектов при вариациях коэффициентов математических моделей, порожденных изменениями параметров объекта.
Введем определения.
Будем полагать, что истинные, но неизвестные нам, значения коэффициентов математической модели находятся внутри интервала
, (1)
или, что то же самое – подчинены неравенствам:
, (2)
где mi - номинальные значения коэффициентов, принятые при расчете,
а εi – числа, малые в сравнении с единицей; конкретные значения этих чисел определяются каждый раз свойствами того или иного конкретного объекта.
Величины miεi будем называть вариациями номинальных коэффициентов mi.
Из неравенств (2) сразу следует, что если какой-либо коэффициент mi равен нулю, то и его вариация равна нулю, т. е. «нуль не варьируется».
Заметим сразу, что если в основу определения вариаций коэффициентов положены неравенства (2), то это означает, что в дальнейшем будут рассматриваться только относительные вариации коэффициентов, а не абсолютные, т. е. не будут рассматриваться «вариации нуля». Такой подход, разумеется, не является единственно возможным. Существуют такие объекты и такие задачи их исследования, в которых можно рассматривать превращения некоторых нулевых коэффициентов в ненулевые. Подобные задачи рассматриваются, например, в теории сингулярно возмущенных дифференциальных уравнений, то есть уравнений, имеющих малые коэффициенты при старших производных. В теории сингулярно возмущенных уравнений могут рассматриваться, например, изменения решений, происходящие при переходе от уравнения
(3)
(которое можно, разумеется, рассматривать как уравнение
(4)
с нулевым коэффициентом при старшей производной) к уравнению
, (5)
где ε – малое число, не равное нулю. Понятно, что решения уравнения (5) почти всегда будут существенно отличаться от решений уравнения (4), даже при сколь угодно малых ε.
Теория сингулярно возмущенных уравнений является важной (и весьма сложной) теорией, но она не имеет почти ничего общего с той теорией, которая будет далее изложена, и которая опирается на определение вариаций через неравенства (2), исключающие вариации нулей.
В дальнейшем изложении будет использоваться понятие «ε – окрестности» системы автономных дифференциальных уравнений. Коэффициенты такой системы можно нумеровать, обозначать числами от до . Примером может служить система
(6)
с четырьмя коэффициентами.
Определение: ε – окрестностью рассматриваемой системы назовем семейство дифференциальных уравнений той же структуры, коэффициенты которых, обозначаемые через , подчинены неравенствам (2).
Теорема: если нулевое решение рассматриваемой системы устойчиво, то для того, чтобы она сохраняла устойчивость при вариациях коэффициентов, подчиненных неравенствам (2), необходимо и достаточно, чтобы в ее ε – окрестности находились только те системы, у которых нулевое решение устойчиво.
Доказательство: если в ε – окрестности находится хотя бы одна система, нулевое решение которой неустойчиво, то при вариациях коэффициентов рассматриваемой системы они могут совпасть с коэффициентами именно этой неустойчивой системы, и тогда решение станет неустойчивым. Это доказывает необходимость условия теоремы. Достаточность очевидна: если в ε – окрестности нет ни одной системы, нулевое решение которой было бы неустойчивым, то при любых вариациях коэффициентов, удовлетворяющим неравенствам (2), устойчивость нулевого решения рассматриваемой системы сохраняется.
Понятие «ε – окрестности» системы будет использовано позже при анализе свойств эквивалентных преобразований.
§2. Вариации решений. Корректные и некорректные решения
При вариациях коэффициентов уравнения (или системы уравнений), его решения также, разумеется, будут испытывать вариации. Зависимость вариаций решений от вариаций коэффициентов может быть различной. Поясним это на простом примере. Пусть изгородью длиною «a» метров нужно огородить прямоугольный участок земли площадью «b» квадратных метров. Обозначив длины сторон прямоугольника через x1 и x2, можно составить уравнения:
; (7)
. (8)
Решая их, нетрудно установить, что x1 и x2 будут двумя решениями квадратного уравнения
,
т. е. ; . (9)
На рис. 1 показаны зависимости x1 и x2 от коэффициента b
для случая a = 8 м.


Рисунок 1
Мы убеждаемся, что при b < 4 м2 значения x1 и x2 зависят от «b» непрерывно. Сколь угодно малым изменениям коэффициента площади огораживания b соответствуют сколь угодно малые изменения x1 и x2. Так, если b = 3, то x1 = 3; x2 = 1. Если b = 3 – ε, то из формул (9) следует, что
. (10)
Формула (10) подтверждает непрерывную зависимость x1 и x2 от площади огораживаемого участка при b < 4. Однако уже при b = 4 непрерывная зависимость исчезает: если b = 4 + ε, где ε > 0, то уже при сколь угодно малых ε вещественные решения исчезают, переходят в комплексные; в этом случае
(11)
и уже при сколь угодно малых ε > 0, вещественных решений нет. Непрерывная зависимость x1 и x2 от b при b = 4 исчезает.
Практически это означает, что если площадь участка больше, чем 4 м2, то огородить его изгородью длиной 8 м нельзя. Длины изгороди не хватит.
Наиболее интересен случай, когда b = 4 м2 (или, для общего случая, когда . В этом случае, используя формулы (9) получаем простое решение:
. (12)
Это решение практического смысла не имеет, потому что оно может измениться коренным образом при сколь угодно малых (а значит и совершенно неизбежных на практике) вариаций параметра b (огораживаемой площади), при сколь угодно малых (а значит – неизбежных) погрешностях при ее измерении.
Далее мы увидим, что подобные явления (отсутствие непрерывной зависимости от коэффициентов и параметров) встречаются довольно часто и имеют большой практический смысл. Поэтому введем важные определения:


  1. Корректными назовем решения, которые зависят от коэффициентов и параметров непрерывно. Сколь угодно малым изменениям коэффициентов и параметров соответствуют сколь угодно малые изменения решений.




  1. Некорректными назовем решения, не имеющие непрерывной зависимости от коэффициентов и параметров. Некорректные решения могут изменяться на конечные величины, или даже вообще измениться коренным образом при сколь угодно малых вариациях коэффициентов и параметров.


Пример: решение только что рассмотренной задачи об огораживании при a = 8 и b = 3 корректно. При a = 8 и b = 4 решение той же задачи – решение x1 = x2 = 4 – некорректно; при b = 4 + ε решение меняется коренным образом (исчезает) даже при сколь угодно малых ε.
Дальнейшее изложение будет основываться на приведенных вполне точных определениях корректных и некорректных решений.
Отметим, что в более ранних учебниках и учебных пособиях в основу изложения было положено не определение корректного (или некорректного) решения, а определение корректно или не корректно поставленной задачи.
Так, в наиболее распространенном учебнике [5], та или иная задача называется корректно поставленной (корректной), если она удовлетворяет следующим трем условиям:


  1. решение существует;




  1. решение единственно;




  1. решение устойчиво – т. е. оно зависит от исходных данных, от коэффициентов и параметров непрерывно.


Если рассматриваемая задача не удовлетворяет хотя бы одному из этих трех условий, то она называется некорректной (некорректно поставленной).
Данное определение неудачно, поскольку далеко не каждую задачу, не имеющую решения, или имеющую множество решений целесообразно относить к некорректным. Так, например, простое уравнение x2 + 1 = 0 не имеет решений в поле действительных чисел; уравнение sin x = 0 имеет бесчисленное множество решений: x = nπ, но задачи нахождения их решений никак не отнесешь к некорректным. Специфику некорректных задач отражает лишь третье условие (точнее – невыполнение третьего условия), а введение первого и второго условия растворяет действительно некорректные задачи в необъятном море задач, в которых решение не существует или не является единственным. А если сам объект исследования (некорректность) точно не определен, то ни о какой «математической строгости» говорить уже не приходится. Было бы, разумеется, желательно использовать более точные определения корректных и некорректных задач, но это сделать трудно, поскольку приведенное ранее определение, состоящие из трех условий, сделалось уже привычным и общепринятым. Введение нового определения корректных и некорректных задач может вызвать путаницу. Для избежания путаницы, в дальнейшем изложении мы будем брать за основу не определение корректных и некорректных задач, а определение корректных и некорректных решений.
Следующим важным объектом исследования, также нуждающимся в хорошем определении, являются плохо обусловленные решения и плохо обусловленные задачи.
Определение: плохо обусловленным решением назовем решение, существенно изменяющееся при малых изменениях исходных условий, коэффициентов и параметров. Плохо обусловленной системой уравнений назовем ту, решения которой являются плохо обусловленными.
Сразу видно, что это определение не является полным, не является замкнутым, не позволяет без дополнительных уточнений судить о плохой или хорошей обусловленности решения. Для того, чтобы определение получило точный смысл, нужно дополнительно определить – какое именно изменение коэффициентов и параметров считать «малым» и какое изменение решения считать существенным.
Пример. Вычислим определитель:
. (13)
Если элементы первого столбца изменятся на ±1%, то решение (величина определителя) может стать, например, равным:
, (14)
т. е. изменится на 9,53%.
Если мы будем считать изменение элементов первого столбца на ±0,01 малым изменением, а изменение решения на ±5% - существенным изменением, то в этом случае решение задачи вычисления определителя (13) будет плохо обусловленным. Если же будем считать существенным изменение решения не менее, чем на 10%, то в этом случае решение задачи вычисления того же определителя уже не будет плохо обусловленным.
Непосредственно видно, что некорректное решение является частным, предельным случаем решения плохо обусловленного – когда место «малого» изменения коэффициентов и параметров занимает «сколь угодно малое» изменение, а место «существенного» изменения решения задачи занимает «конечное» изменение, изменение на любую конечную, а не сколь угодно малую величину.
Определение некорректного решения уже само по себе является полным, вполне замкнутым, никаких уточнений не требует. Поэтому выявление некорректных решений значительно проще, чем плохо обусловленных и именно с проверки возможной некорректности решения нужно начинать решение всех практических задач.
§3. Традиционные методы проверки корректности.
Ошибки и заблуждения

Поскольку сколь угодно малые отклонения действительных значений коэффициентов и параметров математической модели от их расчетных значений в технических задачах неизбежны, то расчет объектов, математические модели которых имеют некорректные решения, чаще всего не имеет смысла и может привести к серьезным ошибкам. Существуют особые методы подхода к задачам с некорректными решениями (регуляризация и т. п.), о которых мы далее расскажем, но если не заметить некорректности решения и решать задачу с некорректными решениями обычными методами, как задачу корректную, то ошибки почти всегда неизбежны.
Поэтому перед практическим использованием решения любой технической или экономической задачи следует обязательно проверить – будет ли это решение корректным.
Существуют два основных метода проверки корректности:


  1. Индивидуальная проверка.




  1. Использование результатов исследования корректности для различных классов математических моделей.


Индивидуальная проверка заключается в том, что вычисление решения повторяется несколько раз, причем каждый раз – при немного измененных значениях коэффициентов и параметров (иногда этот подход называют «методом «покачивания» коэффициентов»).
Пример индивидуальной проверки уже приводился в первой главе, и там же было показано, что в задачах с большим количеством коэффициентов и параметров для проверки корректности может потребоваться огромное количество повторных вычислений – порядка 2n, где n – число коэффициентов и (или) параметров, влияние вариаций которых на корректность решения мы хотим исследовать.
Поэтому наиболее удобным и выгодным является использование второго метода проверки – использование ранее проведенного исследования корректности решений сразу для целых классов математических моделей.
Пример №1.
Задан полином
(15)
и требуется вычислить его корни, которые могут быть и комплексными.
Известно и давно доказано, что положение корней полинома любой степени на комплексной плоскости зависит от коэффициентов полинома непрерывно. При сколь угодно малых вариациях коэффициентов полинома положение его корней на комплексной плоскости изменится мало. Поэтому задача вычисления любого полинома (15) имеет корректное решение. Индивидуальная проверка не нужна.
Пример №2.
Задан тот же полином (15), но на этот раз рассматриваются задачи, в которых физический смысл имеют только вещественные корни; примером может служить уже рассмотренная задача о длине сторон изгороди, огораживающей прямоугольный участок заданной площади. Длины сторон могут быть только вещественными, но не комплексными числами, и ранее, в §2, было показано, что уже для полинома второй степени задача вычисления вещественных корней может иметь некорректное решение. Более полный ответ на вопрос о корректности решений выглядит так: если в числе корней полинома (15) оказались кратные, то решение задачи вычисления его вещественных корней – некорректно. При сколь угодно малых изменениях коэффициентов полинома решение может измениться коренным образом, пара вещественных кратных корней может исчезнуть.
Мы убеждаемся, что проверка корректности решения на основе общих теорем гораздо проще, чем индивидуальная проверка каждой корректной задачи. Однако при использовании общих теорем можно натолкнуться на ошибки и заблуждения.
Пример №3.
Решение задачи об устойчивости решений системы линейных дифференциальных уравнений с постоянными коэффициентами для случая, когда корни характеристического полинома системы лежат в левой половине комплексной плоскости, но не на мнимой оси, традиционно считалось корректным. Действительно, казалось очевидным, что при сколь угодно малом изменении коэффициентов характеристического полинома его корни (зависящие от коэффициентов непрерывно) не могут «перепрыгнуть» из левой полуплоскости в правую.
При этом – как ни странно – в течение многих десятилетий никем не замечалось, что при сколь угодно малых вариациях коэффициентов системы дифференциальных уравнений может измениться степень характеристического полинома (как это было показано в главе первой на примере рассмотренной там системы (28), а это означает, что у него могут появиться новые корни, в том числе и лежащие в правой полуплоскости комплексного переменного. Таким образом, решение задачи об устойчивости системы линейных дифференциальных уравнений с постоянными коэффициентами в общем случае некорректно.
Этот результат (впервые опубликованный в [2]) очень важен. Он раскрывает причину многих происходивших в последнее время аварий и катастроф и позволяет избежать таких аварий в будущем.
Мы еще раз убеждаемся, что математика не является застывшей и завершенной наукой. Даже в сравнительно элементарных ее разделах – таких, как линейные дифференциальные уравнения с постоянными коэффициентами, и даже в свойствах простейших эквивалентных преобразований были в конце XX века сделаны неожиданные открытия, заставившие во многом по-новому взглянуть на проблему обеспечения надежности и достоверности математических вычислений и расчетов.
Так, например, при проверке корректности решений можно, разумеется, пользоваться результатами исследования корректности решений целых классов математических задач, но нужно помнить, что некоторые теоремы о корректности и некорректности, которые ранее считались доказанными, на самом деле неверны и требуют уточнения.
Без такого уточнения – которое мы приведем в последующих главах – надежность и достоверность результатов расчета обеспечена не будет. Связано все это с тем, что в конце XX века неожиданно обнаружили новые свойства у эквивалентных (равносильных) преобразований. А поскольку эти преобразования используются самым широчайшим образом и пронизывают собой все математику сверху донизу, то и оказалось, что многие математические теоремы потребовали уточнения.
К рассмотрению недавно открытых новых свойств эквивалентных преобразований мы перейдем в следующей главе.


<< предыдущая страница   следующая страница >>