Scientific journal
International Journal of Experimental Education
ISSN 2618–7159
ИФ РИНЦ = 0,425

1
1
2278 KB

При нахождении экстремума функции нескольких переменных следует помнить, что её аргументы могут быть или независимыми, или зависимыми переменными. В случае независимых переменных говорят, что решается задача безусловной оптимизации (задача на безусловный экстремум).

В данной статье рассматривается экстремум целевой функции, аргументы которой зависимы между собой.

Задача, означенная в заголовке, – это задача минимизации (или максимизации) заданной функции f на множестве X, определяемом системой конечного числа уравнений («связей»):

dal1.wmf.

Запишем эту задачу в виде

dal2.wmf. (1)

В некоторых случаях возможен следующий подход к отысканию решения задачи (1). Допустимое множество представляет собой систему из m уравнений с n неизвестными, при этом обычно dal3.wmf. Если из этой системы удается m переменных выразить через остальные dal4.wmf переменных, то относительно них получается задача безусловной оптимизации.

Пример 3.1. Почта США принимает посылки в виде ящиков, у которых длина и обхват поперек ее в сумме не превышают 72 дюйма (один дюйм – это 25.4 мм). При каких допустимых размерах посылки ее объем наибольший?

Решение. В очевидных обозначениях имеем задачу dal5.wmf при условиях dal6.wmf. Ясно, что здесь достаточно нестрогое неравенство заменить равенством, и мы имеем задачу (1), в которой

dal7.wmf.

Выразив dal8.wmf из уравнения связи, придем к задаче безусловной оптимизации функции двух переменных (как говорят, понизим размерность задачи)

dal9.wmf,

решением которой будет точка (24; 12).

В этом примере исследование условного экстремума свелось к уже рассмотренному исследованию обычного экстремума функции меньшего числа переменных.

Описанный метод исключения переменных имеет ограниченную область применения, поскольку выразить группу одних переменных через остальные – процедура не всегда однозначная и далеко не всегда легко осуществимая. Более универсальным является метод Лагранжа, основанный на использовании условий экстремума непосредственно для задачи (1).

По определению, функция Лагранжа задачи (1) – это функция

dal10.wmf, (2)

где dal11.wmf. Пусть dal12.wmf – градиент функции Лагранжа по dal13.wmf, dal14.wmf – ее гессиан по dal15.wmf. Следующая теорема (без вывода), лежащая в основе метода Лагранжа, является центральным фактом классической теории условного экстремума.

Теорема 3.1 (необходимое условие минимума первого порядка, или принцип Лагранжа). Пусть функции dal16.wmf – гладкие в некоторой окрестности точки dal17.wmf, являющейся локальным решением задачи (1). Тогда в dal18.wmf существует ненулевой вектор dal19.wmf такой, что dal20.wmf.

Здесь последнее равенство имеет ясный геометрический смысл: с учетом (2) оно означает, что градиенты функций dal21.wmf в точке dal22.wmf являются линейно зависимыми. В частности, если dal23.wmf, то градиенты dal24.wmf должны быть коллинеарными. Напомним, что эти градиенты, если они ненулевые, направлены ортогонально к поверхностям уровня dal25.wmf и dal26.wmf соответственно, причем их коллинеарность говорит о том, что решение dal27.wmf должно быть точкой касания данных поверхностей (при dal28.wmf – линий уровня). Фактически это необходимое условие, или «принцип касания».

Любое дополнительное предположение о задаче (1), обеспечивающее в теореме 3.1 случай dal29.wmf, принято называть условием регулярности. При наличии такого условия и саму задачу (1) называют регулярной. Для нее достаточно рассматривать лишь регулярную функцию Лагранжа

dal30.wmf. (3)

Самым главным примером условия регулярности является условие линейной независимости градиентов функций gi на допустимом множестве.

Теорема 3.2 (достаточное условие минимума второго порядка). Пусть функции dal31.wmf, дважды гладкие в окрестности точки dal32.wmf, гладкие и градиенты dal33.wmf линейно независимы. Пусть существует вектор dal34.wmf со свойствами:

1) для функции (3) dal35.wmf;

2) матрица Гессе dal36.wmf положительно определена на множестве векторов

dal37.wmf,

удовлетворяющих условию

dal38.wmf. (4)

Тогда dal39.wmf – строгое локальное решение задачи (1).

Условие (4) означает, что вектор h ортогонален к линейному пространству, натянутому на градиенты dal40.wmf. Поэтому его называют условием ортогональности. Ясно, что если задачу (1) заменить задачей максимизации, а в условии 2) потребовать, чтобы матрица Гессе была отрицательно определенной, то в точке dal41.wmf целевая функция имеет строгий локальный максимум.

На практике обычно имеет место случай, когда целевая функция f и все функции gi, дважды гладкие в некоторой области dal42.wmf, содержащей допустимое множество, причем градиенты функций gi линейно независимы. Проверив эту независимость, далее для решения задачи (1) надлежит сделать следующее.

1. Составить функцию Лагранжа (3) и найти ее градиент по x.

2. Потребовать, чтобы построенный градиент был равен нулю. К полученной системе уравнений добавить уравнения связей и решить возникшую систему. Пусть dal43.wmf – одно из этих решений (стационарная точка функции Лагранжа по всем переменным). Числа dal44.wmf называются множителями Лагранжа, соответствующими точке dal45.wmf. Эта точка является «подозрительной» на экстремум целевой функции.

3. Исследовать на знакоопределенность гессиан функции Лагранжа по x в точке dal46.wmf при условии ортогональности и сделать заключение в соответствии с теоремой 3.2.

Вектор h в теореме 3.2, как и в случае безусловной оптимизации, состоит из приращений аргументов, т.е. их дифференциалов:

dal47.wmf.

Тогда условие ортогональности (4) можно записать в виде

dal48.wmf.

На шаге 3 указанной схемы при этих условиях надо исследовать на знакоопределенность квадратичную форму матрицы Гессе dal49.wmf, т.е. второй дифференциал dal50.wmf функции Лагранжа по x.

Пример 3.2. Найти экстремальные значения функции dal51.wmf на прямой dal52.wmf.

Решение. Имеем случай dal53.wmf. Условие «градиенты функций gi линейно независимы» в данном случае означает, что градиент функции dal54.wmf отличен от нуля. Но это так, ибо dal55.wmf. Далее действуем в соответствии с описанной трехшаговой схемой.

1. Составим регулярную функцию Лагранжа

dal56.wmf,

найдем ее градиент по переменным dal57.wmf:

dal58.wmf.

2. Решением системы уравнений

dal59.wmf.

является единственная точка dal60.wmf.

3. Составим матрицу Гессе функции Лагранжа. В любой точке, в частности, в найденной, она равна

dal61.wmf.

Отсюда dal62.wmf. Полученная квадратичная форма пока знакопеременная. Например, ее значение при dal63.wmf равно –2, а при dal64.wmf оно равно 2. Но ведь мы не учитывали уравнение связи. Из него имеем dal65.wmf. Тогда dal66.wmf, т.е. второй дифференциал есть отрицательно определенная квадратичная форма. Следовательно, точка dal67.wmf является точкой локального условного максимума целевой функции, равного 3.

Пример 3.3. Найти точки условного экстремума функции dal68.wmf при условиях

dal69.wmf.

Решение. Градиенты функций dal70.wmf (выпишите их) коллинеарны при dal71.wmf. Но точка с равными координатами не может лежать на допустимом множестве X, описываемом равенствами dal72.wmf. Следовательно, можно решать регулярную задачу.

dal73.wmf

Решаем систему уравнений

dal74.wmf, (5)

dal75.wmf, (6)

dal76.wmf, (7)

dal77.wmf, (8)

dal78.wmf. (9)

Как наиболее эффективно решить эту систему? Один из подходов состоит в следующем: умножим обе части первого уравнения на x, второго – на y, третьего – на z, после чего все три уравнения сложим. В силу (8), (9) получим

dal79.wmf. (10)

После этого уравнения (5) – (7) примут вид

dal80.wmf, (5а)

dal81.wmf, (6а)

dal82.wmf, (7а)

Из уравнения (5а) вычтем (6а). После некоторых преобразований получим

dal83.wmf.

Здесь множитель Лагранжа не должен быть нулевым, поэтому dal84.wmf или dal85.wmf. Добавляя к последнему равенству уравнения связи, придем к несовместной системе. Но система уравнений из (8) и (9) и dal86.wmf имеет два решения dal87.wmf.

Повторяя затем поочередно описанную процедуру с уравнениями (5а), (7а) и (6а), (7а), получим еще 4 решения. Итого будем иметь 6 точек, «подозрительных» на экстремум целевой функции:

dal88.wmf

Составим гессиан функции Лагранжа по x,y,z в произвольной точке:

dal89.wmf.

Точке M1, согласно (10), соответствует множитель Лагранжа dal90.wmf. Исследуем гессиан

dal91.wmf.

Из равенств (8), (9) имеем

dal92.wmf

Точке dal93.wmf соответствуют равенства

dal94.wmf.

Второй дифференциал функции Лагранжа, или, что то же, квадратичная форма матрицы dal95.wmf, имеет вид

dal96.wmf

Или

dal97.wmf

Следовательно, в точке dal98.wmf целевая функция имеет минимум, равный – 2. Таков же результат в отношении точек dal99.wmf. В остальных точках будет максимум, равный 2.

Выделение точек условного экстремума входит составной частью в решение задачи о нахождении наибольшего и наименьшего значений функции в замкнутой ограниченной области dal100.wmf. Используется следующий факт: экстремум дифференцируемой функции достигается либо во внутренней стационарной точке области, либо на ее границе.

Пример 3.4. Найти наибольшее и наименьшее значения функции

dal101.wmf

в полушаре

dal102.wmf.

Решение. Приведем краткое решение, опуская детали, которые читателю следует воспроизвести. Единственная стационарная точка dal103.wmf лежит внутри области, поэтому займемся исследованием поведения функции на ее границе. Эта граница состоит из полусферы

dal104.wmf

и круга

dal105.wmf.

Применяя метод Лагранжа, нетрудно убедиться в том, что на полусфере единственной возможной точкой экстремума является

dal106.wmf.

Внутри круга находится только одна стационарная точка

dal107.wmf.

Снова, применяя метод Лагранжа, обнаруживаем две «подозрительные» на экстремум точки границы круга

dal108.wmf.

Итак, искомые значения могут достигаться только в указанных пяти точках. Составим вектор значений целевой функции в этих точках

dal109.wmf,

найдем его наименьший и наибольший элементы. Получим ответ: наименьшее значение, равное – 3, достигается в первой точке; наибольшее – в последней точке и равно dal110.wmf.

В заключение статьи сделаем важное замечание по применению метода Лагранжа. Используя его, надо аккуратно проверять условие линейной независимости градиентов функций, задающих уравнения связи. Если это условие не выполняется, то метод может и не дать некоторых точек экстремума целевой функции. Например, пусть на плоскости требуется найти расстояние от начала координат до полукубической параболы dal111.wmf. Другими словами, надо найти минимум функции цели dal112.wmf при условии dal113.wmf. Геометрически очевидно, что искомое расстояние равно 1 и достигается в точке dal114.wmf, в которой градиент функции dal115.wmf нулевой. Но с помощью правила Лагранжа мы не можем получить эту точку, так как системе уравнений

dal116.wmf

ее координаты не удовлетворяют.

Более обстоятельный разговор об использовании метода множителей Лагранжа читатель найдет в нашей работе [1].