Денис Аветисян — Страница 473

Привычки, работа и достойная старость: как планировать будущее

05.02.2026 от Денис Аветисян

Оптимальный объём трудовых ресурсов определяется как возрастом работника, так и соотношением между его богатством и привычным уровнем потребления, что отражает взаимосвязь между экономическим положением и готовностью к труду на протяжении жизни.

Новая модель объединяет экономическое поведение человека, формирование привычек и финансовое планирование, чтобы помочь определить оптимальную стратегию выхода на пенсию.

Алфавит и Время: Размышления об Инвестициях

05.02.2026 от Денис Аветисян

Не берусь утверждать, что Alphabet удастся сохранить такую динамику в ближайшие десятилетия. Ведь инерция прошлых успехов – вещь обманчивая. Однако, если даже снизить предполагаемый темп роста на скромные 10%, приняв, что в среднем компания будет приносить 15% годовой прибыли в течение следующих 21 года, то сегодняшняя инвестиция в 1000 долларов, при должном терпении, может вырасти до более чем 18 000 долларов. Цифра, конечно, притягательная, но не стоит забывать, что рынок – это не благотворительная организация.

Алфавит и облака: Цена прогресса

05.02.2026 от Денис Аветисян

В этой атмосфере неопределенности, корпорация Alphabet (GOOGL 1.89%) (GOOG 2.16%) попыталась дать ответ в своем квартальном отчете, представленном на днях. И ответ этот оказался неутешительным для тех, кто ждал чудес. Спрос на ИИ, безусловно, подпитывает рост облачного сегмента, но рост этот требует постоянных, все возрастающих инвестиций. Ибо аппетит капитала, как известно, ненасытен.

Иллюзии и Металл: Оценка CoreWeave

05.02.2026 от Денис Аветисян

Но Nvidia, оказывается, не только производитель. Она еще и инвестор. И куда она вкладывает свои деньги? В основном – в одну компанию. В CoreWeave. Более 85% портфеля. Довольно смелое решение, не правда ли? Или отчаянное? Подумаем вместе.

Обучение языковых моделей: новый подход к управлению градиентами

05.02.2026 от Денис Аветисян

$Предлагаемый трехэтапный фреймворк обучения EG-SPO сначала использует демонстрации экспертов для предварительной настройки политики с помощью чистого SFT-подхода, затем генерирует траектории модели, вычисляя энтропию для каждого токена, и, наконец, направляет токены с высокой энтропией на полное обновление PPO для поощрения исследования, а токены с низкой энтропией - на PPO с φ-атенюацией для снижения дисперсии и сохранения знаний, при этом обе ветви сохраняют преимущество [latex]A_{t}[/latex] для обеспечения градиентов, учитывающих преимущество и избегающих усиления уверенных ошибок.$

В статье представлен инновационный метод гибридного обучения, позволяющий повысить стабильность и эффективность больших языковых моделей.