Привычки, работа и достойная старость: как планировать будущее

Новая модель объединяет экономическое поведение человека, формирование привычек и финансовое планирование, чтобы помочь определить оптимальную стратегию выхода на пенсию.

Новая модель объединяет экономическое поведение человека, формирование привычек и финансовое планирование, чтобы помочь определить оптимальную стратегию выхода на пенсию.

Не берусь утверждать, что Alphabet удастся сохранить такую динамику в ближайшие десятилетия. Ведь инерция прошлых успехов – вещь обманчивая. Однако, если даже снизить предполагаемый темп роста на скромные 10%, приняв, что в среднем компания будет приносить 15% годовой прибыли в течение следующих 21 года, то сегодняшняя инвестиция в 1000 долларов, при должном терпении, может вырасти до более чем 18 000 долларов. Цифра, конечно, притягательная, но не стоит забывать, что рынок – это не благотворительная организация.

В этой атмосфере неопределенности, корпорация Alphabet (GOOGL 1.89%) (GOOG 2.16%) попыталась дать ответ в своем квартальном отчете, представленном на днях. И ответ этот оказался неутешительным для тех, кто ждал чудес. Спрос на ИИ, безусловно, подпитывает рост облачного сегмента, но рост этот требует постоянных, все возрастающих инвестиций. Ибо аппетит капитала, как известно, ненасытен.

Но Nvidia, оказывается, не только производитель. Она еще и инвестор. И куда она вкладывает свои деньги? В основном – в одну компанию. В CoreWeave. Более 85% портфеля. Довольно смелое решение, не правда ли? Или отчаянное? Подумаем вместе.
![Предлагаемый трехэтапный фреймворк обучения EG-SPO сначала использует демонстрации экспертов для предварительной настройки политики с помощью чистого SFT-подхода, затем генерирует траектории модели, вычисляя энтропию для каждого токена, и, наконец, направляет токены с высокой энтропией на полное обновление PPO для поощрения исследования, а токены с низкой энтропией - на PPO с φ-атенюацией для снижения дисперсии и сохранения знаний, при этом обе ветви сохраняют преимущество [latex]A_{t}[/latex] для обеспечения градиентов, учитывающих преимущество и избегающих усиления уверенных ошибок.](https://arxiv.org/html/2602.03309v1/figures/fig1_eg-spo.png)
В статье представлен инновационный метод гибридного обучения, позволяющий повысить стабильность и эффективность больших языковых моделей.