Итерационное выпуклое оценивание линейных регрессионных моделей в условиях стохастической неоднородности данных Научная публикация
Журнал |
Вестник Самарского государственного технического университета. Серия: Физико-математические науки
ISSN: 1991-8615 |
||||
---|---|---|---|---|---|
Вых. Данные | Год: 2025, Том: 29, Номер: 2, Страницы: 294-318 Страниц : 25 DOI: 10.14498/vsgtu2138 | ||||
Ключевые слова | линейная регрессия, робастное оценивание, стохастическая неоднородность данных, взвешенный метод наименьших модулей, метод наименьших квадратов, невыпуклые функции потерь, итерационные алгоритмы, устойчивость регрессионных моделей | ||||
Авторы |
|
||||
Организации |
|
Информация о финансировании (1)
1 | Министерство науки и высшего образования РФ | 0327-2024-0015 |
Реферат:
Одной из ключевых проблем линейного регрессионного анализа является обеспечение робастного оценивания параметров модели в условиях стохастической неоднородности данных. В подобных случаях оценки классического метода наименьших квадратов теряют устойчивость. Данная проблема особенно актуальна при распределениях ошибок с более вытянутыми хвостами по сравнению с нормальным распределением. В качестве одного из подходов к повышению робастности регрессионных моделей рассматривается замена квадратичной функции потерь на выпукло-вогнутую, однако непосредственное применение таких функций приводит к многоэкстремальности целевой функции, что существенно усложняет решение задачи. Целью настоящего исследования является анализ свойств метода вариационно-взвешенных квадратических и абсолютных приближений для невыпуклых функций потерь. В работе предложен подход, основанный на замене исходной невыпуклой задачи регрессионного оценивания на итеративное применение взвешенных методов наименьших квадратов и наименьших модулей. Фактически реализуется метод вариационно-взвешенных квадратических и абсолютных приближений для невыпуклых функций потерь. На каждой итерации взвешенного метода наименьших модулей использовались алгоритмы спуска по узловым прямым. Исследование итерационных алгоритмов проведено методом статистических испытаний Монте–Карло для различных функций потерь. Установлено, что взвешенный метод наименьших модулей превосходит метод наименьших квадратов по быстродействию при сопоставимой точности оценивания. В условиях одновременного нарушения нескольких предпосылок регрессионного анализа для достижения приемлемой точности предпочтительным является использование либо взвешенного метода наименьших модулей, либо обобщенного метода наименьших модулей, реализованного в виде алгоритма обобщенного спуска. Получены оценки вычислительной сложности алгоритмов и времени их выполнения в зависимости от объема выборки и количества параметров регрессионной модели.
Библиографическая ссылка:
Голованов О.А.
, Тырсин А.Н.
Итерационное выпуклое оценивание линейных регрессионных моделей в условиях стохастической неоднородности данных
Вестник Самарского государственного технического университета. Серия: Физико-математические науки. 2025. Т.29. №2. С.294-318. DOI: 10.14498/vsgtu2138 OpenAlex
Итерационное выпуклое оценивание линейных регрессионных моделей в условиях стохастической неоднородности данных
Вестник Самарского государственного технического университета. Серия: Физико-математические науки. 2025. Т.29. №2. С.294-318. DOI: 10.14498/vsgtu2138 OpenAlex
Даты:
Поступила в редакцию: | 22 нояб. 2024 г. |
Опубликована в печати: | 13 мая 2025 г. |
Опубликована online: | 13 мая 2025 г. |
Идентификаторы БД:
OpenAlex: | W4412014134 |
Цитирование в БД:
Пока нет цитирований