КЛАССИЧЕСКАЯ ЗАДАЧА НА УСЛОВНЫЙ ЭКСТРЕМУМ И ЕЁ РЕШЕНИЕ

Далингер В.А. 1

1 Омский государственный педагогический университет

2278 KB

1. Далингер В.А., Симонженков С.Д. Метод множителей Лагранжа и его применения: учебное пособие. – Омск: Изд-во ООО «Амфора», 2012. – 115 с.

При нахождении экстремума функции нескольких переменных следует помнить, что её аргументы могут быть или независимыми, или зависимыми переменными. В случае независимых переменных говорят, что решается задача безусловной оптимизации (задача на безусловный экстремум).

В данной статье рассматривается экстремум целевой функции, аргументы которой зависимы между собой.

Задача, означенная в заголовке, – это задача минимизации (или максимизации) заданной функции f на множестве X, определяемом системой конечного числа уравнений («связей»):

dal1.wmf .

Запишем эту задачу в виде

dal2.wmf . (1)

В некоторых случаях возможен следующий подход к отысканию решения задачи (1). Допустимое множество представляет собой систему из m уравнений с n неизвестными, при этом обычно dal3.wmf . Если из этой системы удается m переменных выразить через остальные dal4.wmf переменных, то относительно них получается задача безусловной оптимизации.

Пример 3.1. Почта США принимает посылки в виде ящиков, у которых длина и обхват поперек ее в сумме не превышают 72 дюйма (один дюйм – это 25.4 мм). При каких допустимых размерах посылки ее объем наибольший?

Решение. В очевидных обозначениях имеем задачу dal5.wmf при условиях dal6.wmf . Ясно, что здесь достаточно нестрогое неравенство заменить равенством, и мы имеем задачу (1), в которой

dal7.wmf .

Выразив dal8.wmf из уравнения связи, придем к задаче безусловной оптимизации функции двух переменных (как говорят, понизим размерность задачи)

dal9.wmf ,

решением которой будет точка (24; 12).

В этом примере исследование условного экстремума свелось к уже рассмотренному исследованию обычного экстремума функции меньшего числа переменных.

Описанный метод исключения переменных имеет ограниченную область применения, поскольку выразить группу одних переменных через остальные – процедура не всегда однозначная и далеко не всегда легко осуществимая. Более универсальным является метод Лагранжа, основанный на использовании условий экстремума непосредственно для задачи (1).

По определению, функция Лагранжа задачи (1) – это функция

dal10.wmf , (2)

где dal11.wmf . Пусть dal12.wmf – градиент функции Лагранжа по dal13.wmf , dal14.wmf – ее гессиан по dal15.wmf . Следующая теорема (без вывода), лежащая в основе метода Лагранжа, является центральным фактом классической теории условного экстремума.

Теорема 3.1 (необходимое условие минимума первого порядка, или принцип Лагранжа). Пусть функции dal16.wmf – гладкие в некоторой окрестности точки dal17.wmf , являющейся локальным решением задачи (1). Тогда в dal18.wmf существует ненулевой вектор dal19.wmf такой, что dal20.wmf .

Здесь последнее равенство имеет ясный геометрический смысл: с учетом (2) оно означает, что градиенты функций dal21.wmf в точке dal22.wmf являются линейно зависимыми. В частности, если dal23.wmf , то градиенты dal24.wmf должны быть коллинеарными. Напомним, что эти градиенты, если они ненулевые, направлены ортогонально к поверхностям уровня dal25.wmf и dal26.wmf соответственно, причем их коллинеарность говорит о том, что решение dal27.wmf должно быть точкой касания данных поверхностей (при dal28.wmf – линий уровня). Фактически это необходимое условие, или «принцип касания».

Любое дополнительное предположение о задаче (1), обеспечивающее в теореме 3.1 случай dal29.wmf , принято называть условием регулярности. При наличии такого условия и саму задачу (1) называют регулярной. Для нее достаточно рассматривать лишь регулярную функцию Лагранжа

dal30.wmf . (3)

Самым главным примером условия регулярности является условие линейной независимости градиентов функций gi на допустимом множестве.

Теорема 3.2 (достаточное условие минимума второго порядка). Пусть функции dal31.wmf , дважды гладкие в окрестности точки dal32.wmf , гладкие и градиенты dal33.wmf линейно независимы. Пусть существует вектор dal34.wmf со свойствами:

1) для функции (3) dal35.wmf ;

2) матрица Гессе dal36.wmf положительно определена на множестве векторов

dal37.wmf ,

удовлетворяющих условию

dal38.wmf . (4)

Тогда dal39.wmf – строгое локальное решение задачи (1).

Условие (4) означает, что вектор h ортогонален к линейному пространству, натянутому на градиенты dal40.wmf . Поэтому его называют условием ортогональности. Ясно, что если задачу (1) заменить задачей максимизации, а в условии 2) потребовать, чтобы матрица Гессе была отрицательно определенной, то в точке dal41.wmf целевая функция имеет строгий локальный максимум.

На практике обычно имеет место случай, когда целевая функция f и все функции gi, дважды гладкие в некоторой области dal42.wmf , содержащей допустимое множество, причем градиенты функций gi линейно независимы. Проверив эту независимость, далее для решения задачи (1) надлежит сделать следующее.

1. Составить функцию Лагранжа (3) и найти ее градиент по x.

2. Потребовать, чтобы построенный градиент был равен нулю. К полученной системе уравнений добавить уравнения связей и решить возникшую систему. Пусть dal43.wmf – одно из этих решений (стационарная точка функции Лагранжа по всем переменным). Числа dal44.wmf называются множителями Лагранжа, соответствующими точке dal45.wmf . Эта точка является «подозрительной» на экстремум целевой функции.

3. Исследовать на знакоопределенность гессиан функции Лагранжа по x в точке dal46.wmf при условии ортогональности и сделать заключение в соответствии с теоремой 3.2.

Вектор h в теореме 3.2, как и в случае безусловной оптимизации, состоит из приращений аргументов, т.е. их дифференциалов:

dal47.wmf .

Тогда условие ортогональности (4) можно записать в виде

dal48.wmf .

На шаге 3 указанной схемы при этих условиях надо исследовать на знакоопределенность квадратичную форму матрицы Гессе dal49.wmf , т.е. второй дифференциал dal50.wmf функции Лагранжа по x.

Пример 3.2. Найти экстремальные значения функции dal51.wmf на прямой dal52.wmf .

Решение. Имеем случай dal53.wmf . Условие «градиенты функций gi линейно независимы» в данном случае означает, что градиент функции dal54.wmf отличен от нуля. Но это так, ибо dal55.wmf . Далее действуем в соответствии с описанной трехшаговой схемой.

1. Составим регулярную функцию Лагранжа

dal56.wmf ,

найдем ее градиент по переменным dal57.wmf :

dal58.wmf .

2. Решением системы уравнений

dal59.wmf .

является единственная точка dal60.wmf .

3. Составим матрицу Гессе функции Лагранжа. В любой точке, в частности, в найденной, она равна

dal61.wmf .

Отсюда dal62.wmf . Полученная квадратичная форма пока знакопеременная. Например, ее значение при dal63.wmf равно –2, а при dal64.wmf оно равно 2. Но ведь мы не учитывали уравнение связи. Из него имеем dal65.wmf . Тогда dal66.wmf , т.е. второй дифференциал есть отрицательно определенная квадратичная форма. Следовательно, точка dal67.wmf является точкой локального условного максимума целевой функции, равного 3.

Пример 3.3. Найти точки условного экстремума функции dal68.wmf при условиях

dal69.wmf .

Решение. Градиенты функций dal70.wmf (выпишите их) коллинеарны при dal71.wmf . Но точка с равными координатами не может лежать на допустимом множестве X, описываемом равенствами dal72.wmf . Следовательно, можно решать регулярную задачу.

dal73.wmf

Решаем систему уравнений

dal74.wmf , (5)

dal75.wmf , (6)

dal76.wmf , (7)

dal77.wmf , (8)

dal78.wmf . (9)

Как наиболее эффективно решить эту систему? Один из подходов состоит в следующем: умножим обе части первого уравнения на x, второго – на y, третьего – на z, после чего все три уравнения сложим. В силу (8), (9) получим

dal79.wmf . (10)

После этого уравнения (5) – (7) примут вид

dal80.wmf , (5а)

dal81.wmf , (6а)

dal82.wmf , (7а)

Из уравнения (5а) вычтем (6а). После некоторых преобразований получим

dal83.wmf .

Здесь множитель Лагранжа не должен быть нулевым, поэтому dal84.wmf или dal85.wmf . Добавляя к последнему равенству уравнения связи, придем к несовместной системе. Но система уравнений из (8) и (9) и dal86.wmf имеет два решения dal87.wmf .

Повторяя затем поочередно описанную процедуру с уравнениями (5а), (7а) и (6а), (7а), получим еще 4 решения. Итого будем иметь 6 точек, «подозрительных» на экстремум целевой функции:

dal88.wmf

Составим гессиан функции Лагранжа по x,y,z в произвольной точке:

dal89.wmf .

Точке M1, согласно (10), соответствует множитель Лагранжа dal90.wmf . Исследуем гессиан

dal91.wmf .

Из равенств (8), (9) имеем

dal92.wmf

Точке dal93.wmf соответствуют равенства

dal94.wmf .

Второй дифференциал функции Лагранжа, или, что то же, квадратичная форма матрицы dal95.wmf , имеет вид

dal96.wmf

Или

dal97.wmf

Следовательно, в точке dal98.wmf целевая функция имеет минимум, равный – 2. Таков же результат в отношении точек dal99.wmf . В остальных точках будет максимум, равный 2.

Выделение точек условного экстремума входит составной частью в решение задачи о нахождении наибольшего и наименьшего значений функции в замкнутой ограниченной области dal100.wmf . Используется следующий факт: экстремум дифференцируемой функции достигается либо во внутренней стационарной точке области, либо на ее границе.

Пример 3.4. Найти наибольшее и наименьшее значения функции

dal101.wmf

в полушаре

dal102.wmf .

Решение. Приведем краткое решение, опуская детали, которые читателю следует воспроизвести. Единственная стационарная точка dal103.wmf лежит внутри области, поэтому займемся исследованием поведения функции на ее границе. Эта граница состоит из полусферы

dal104.wmf

и круга

dal105.wmf .

Применяя метод Лагранжа, нетрудно убедиться в том, что на полусфере единственной возможной точкой экстремума является

dal106.wmf .

Внутри круга находится только одна стационарная точка

dal107.wmf .

Снова, применяя метод Лагранжа, обнаруживаем две «подозрительные» на экстремум точки границы круга

dal108.wmf .

Итак, искомые значения могут достигаться только в указанных пяти точках. Составим вектор значений целевой функции в этих точках

dal109.wmf ,

найдем его наименьший и наибольший элементы. Получим ответ: наименьшее значение, равное – 3, достигается в первой точке; наибольшее – в последней точке и равно dal110.wmf .

В заключение статьи сделаем важное замечание по применению метода Лагранжа. Используя его, надо аккуратно проверять условие линейной независимости градиентов функций, задающих уравнения связи. Если это условие не выполняется, то метод может и не дать некоторых точек экстремума целевой функции. Например, пусть на плоскости требуется найти расстояние от начала координат до полукубической параболы dal111.wmf . Другими словами, надо найти минимум функции цели dal112.wmf при условии dal113.wmf . Геометрически очевидно, что искомое расстояние равно 1 и достигается в точке dal114.wmf , в которой градиент функции dal115.wmf нулевой. Но с помощью правила Лагранжа мы не можем получить эту точку, так как системе уравнений

dal116.wmf

ее координаты не удовлетворяют.

Более обстоятельный разговор об использовании метода множителей Лагранжа читатель найдет в нашей работе [1].

Библиографическая ссылка

Далингер В.А. КЛАССИЧЕСКАЯ ЗАДАЧА НА УСЛОВНЫЙ ЭКСТРЕМУМ И ЕЁ РЕШЕНИЕ // Международный журнал экспериментального образования. 2015. № 12-2. С. 256-260;
URL: https://expeducation.ru/ru/article/view?id=9078 (дата обращения: 28.12.2025).

Научный журнал
Международный журнал экспериментального образования

ISSN 2618–7159

ИФ РИНЦ = 0,827

Библиографическая ссылка

Международный журнал экспериментального образования
Научный журнал | ISSN 2618–7159 | ПИ №77-60736