Наука — Страница 14

Интеллектуальное управление портфелем: новый подход к оптимизации инвестиций

17.04.2026 от Денис Аветисян

Исследование предлагает инновационную систему оптимизации инвестиционных портфелей, способную адаптироваться к меняющимся рыночным условиям и ограниченности данных.

Поиск антител нового поколения: алгоритм BOAT на службе биоинженерии

17.04.2026 от Денис Аветисян

Новая платформа оптимизации на основе байесовских методов позволяет эффективно исследовать пространство последовательностей антител, находя оптимальный баланс между различными характеристиками.

За гранью стационарности: Новый подход к глобальной невыпуклой оптимизации

17.04.2026 от Денис Аветисян

$Траектория метода БПМ при [latex] t=2\pi [/latex], стартующая из точки [latex] x_0 = 20 [/latex], демонстрирует поведение функции [latex] f(x) = |x| + 10\sin(x) [/latex], что иллюстрирует динамику исследуемой системы (пример 1).$

В статье представлен инновационный метод, позволяющий находить глобальные решения в задачах невыпуклой оптимизации, преодолевая ограничения традиционных подходов.

Оптимизация в условиях неопределенности: новый подход

17.04.2026 от Денис Аветисян

В статье представлен инновационный метод оптимизации, позволяющий эффективно решать сложные задачи в условиях многоступенчатой неопределенности и рисков.

Обучение с подкреплением: Новый подход к сложным задачам

16.04.2026 от Денис Аветисян

$Обучение с использованием TPO приводит к самозатуханию градиента, что выражается в снижении норм L2 градиентов в процессе тренировки, тогда как в GRPO градиент сохраняет свою силу (H=8H{=}8, V=2V{=}2, K=32K{=}32), при этом успешные кандидаты в TPO демонстрируют меньшую целевую массу [latex]q_i[/latex], в то время как в GRPO - меньшую норму весов [latex]|A_i||A|_i[/latex].$

В статье представлена методика Target Policy Optimization, позволяющая эффективно обучать агентов в условиях редкого вознаграждения и при использовании больших языковых моделей.