Обучение моделей вязкости льда с помощью нейросетей

Автор: Денис Аветисян


Новый подход позволяет извлекать сложные реологические характеристики морского и наземного льда непосредственно из данных, открывая возможности для более точного моделирования и прогнозирования.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал
Проведенное исследование демонстрирует возможность точного определения эффективной вязкости морского льда на основе зашумленных данных о напряжениях и скоростях, при этом средние значения, полученные из десяти моделей, инферензированных из различных выборок ошибок, и их стандартные отклонения, позволяют оценить надёжность полученных результатов и решить уравнение $50$ с учётом $55$ в условиях обучения.
Проведенное исследование демонстрирует возможность точного определения эффективной вязкости морского льда на основе зашумленных данных о напряжениях и скоростях, при этом средние значения, полученные из десяти моделей, инферензированных из различных выборок ошибок, и их стандартные отклонения, позволяют оценить надёжность полученных результатов и решить уравнение $50$ с учётом $55$ в условиях обучения.

Разработанный метод использует нейронные сети для определения зависимостей вязкости от параметров, обеспечивая физическую согласованность и устойчивость моделей.

Сложность точного описания реологических свойств сложных сред, таких как ледники и морской лёд, часто ограничивает возможности их адекватного моделирования. В работе, озаглавленной ‘Learning parameter-dependent shear viscosity from data, with application to sea and land ice’, предложен инновационный подход к определению реологических моделей на основе данных с использованием нейронных сетей. Разработанная методика позволяет выводить параметры вязкости, зависящие от внешних факторов, обеспечивая при этом физическую согласованность и устойчивость полученных моделей за счет соблюдения принципов изотропии и выпуклости потенциала диссипации. Способна ли эта технология открыть новые возможности для точного прогнозирования поведения ледовых образований и улучшения климатических моделей?


Точность моделирования льда: вызов климатической науке

Точное моделирование неньютоновских жидкостей, таких как лед и ледники, играет решающую роль в прогнозировании последствий изменения климата. Эти вещества демонстрируют сложное поведение, отклоняющееся от простых законов вязкости, что делает их моделирование особенно сложной задачей. Изменение климата ускоряет таяние ледников и ледяных щитов, что приводит к повышению уровня моря и изменению океанских течений. Понимание реологических свойств льда, его способности течь и деформироваться под воздействием различных сил, необходимо для точного прогнозирования скорости этих процессов и их влияния на глобальную климатическую систему. Неточности в моделях могут приводить к значительным ошибкам в прогнозах, что затрудняет разработку эффективных стратегий адаптации и смягчения последствий изменения климата. Поэтому разработка и применение передовых моделей, учитывающих сложное поведение льда, является критически важной задачей для климатологов и геофизиков.

Традиционные конститутивные модели, используемые для описания течения сложных жидкостей, таких как ледники и лавы, зачастую базируются на упрощающих предположениях о структуре и поведении материала. Эти упрощения, например, линейная вязкость или игнорирование эффектов памяти и истории деформации, позволяют получить аналитические решения и снизить вычислительную сложность. Однако, в реальности, сложные жидкости демонстрируют гораздо более разнообразные и нелинейные свойства. Такие явления, как тиксотропия, реология с памятью и неоднородность материала, не могут быть адекватно описаны упрощенными моделями. В результате, предсказания, основанные на этих моделях, могут значительно отклоняться от реальных наблюдений, что особенно критично при моделировании глобальных процессов, таких как таяние ледников и изменение климата. Необходимость разработки более точных и сложных моделей, учитывающих широкий спектр реологических свойств, становится все более очевидной для адекватного понимания и прогнозирования поведения сложных жидкостей в различных природных и промышленных условиях.

Непосредственное определение реологических параметров сложных жидкостей, таких как ледники и лавины, из наблюдаемых данных представляет собой серьезную задачу из-за явления не однозначности решения – множества различных реологических моделей могут соответствовать одним и тем же наблюдениям. Эта не однозначность усугубляется необходимостью решения обратной задачи, где параметры материала выводятся из его отклика на внешние силы. Решение этой задачи требует значительных вычислительных ресурсов, особенно при моделировании крупномасштабных явлений или сложных геометрий. Поиск оптимальных параметров требует итеративных численных методов, которые могут быть крайне затратными по времени и требовать высокопроизводительных вычислительных систем. В связи с этим, разработка эффективных и надежных алгоритмов для инверсии данных и снижения вычислительной сложности является ключевой задачей в моделировании сложных жидкостей и прогнозировании климатических изменений.

Сравнение расчетов скорости течения ледника Аролла с использованием закона Глена и инференционной реологической модели показывает, что последний позволяет получить более точные результаты, особенно в областях с высокой деформацией, что подтверждается незначительной разницей в полях скорости и температурных профилях.
Сравнение расчетов скорости течения ледника Аролла с использованием закона Глена и инференционной реологической модели показывает, что последний позволяет получить более точные результаты, особенно в областях с высокой деформацией, что подтверждается незначительной разницей в полях скорости и температурных профилях.

Вывод реологических свойств: нейросетевой подход

Представленная рамка для вывода реологических свойств материалов объединяет возможности нейронных сетей и строгость физически обоснованного моделирования. Рамка использует нейронные сети для аппроксимации конститутивных соотношений сложных жидкостей, что позволяет описывать их поведение при деформации. В отличие от традиционных методов, основанных исключительно на эмпирических данных, данный подход интегрирует физические законы, обеспечивая получение физически корректных и обобщающих параметров реологии. Это достигается за счет обучения нейронных сетей на данных о течении жидкостей с использованием методов оптимизации, учитывающих уравнения, описывающие динамику жидкостей, такие как уравнение Навье-Стокса ($ \nabla \cdot \mathbf{\sigma} + \mathbf{f} = 0 $), где $ \mathbf{\sigma} $ – тензор напряжений, а $ \mathbf{f} $ – внешние силы.

В основе предложенного подхода лежит оптимизация, обусловленная частными дифференциальными уравнениями (PDE-Constrained Optimization), которая используется для обучения нейронных сетей, моделирующих конститутивные соотношения сложных жидкостей. Этот метод предполагает представление реологического поведения жидкости через нейронную сеть, выходные данные которой служат решением соответствующего $PDE$. В процессе обучения, функция потерь включает в себя как расхождение между предсказанным и наблюдаемым поведением потока, так и несоблюдение $PDE$. Минимизация этой комбинированной функции потерь позволяет нейронной сети изучать физически согласованные реологические параметры, описывающие поведение жидкости, и обеспечивает соответствие модели фундаментальным законам гидродинамики.

В основе обучения модели лежит минимизация расхождений между смоделированным и наблюдаемым поведением течения жидкости. Процесс оптимизации направлен на снижение функции потерь, которая количественно оценивает разницу между предсказанными значениями физических величин (например, скорости и напряжения сдвига) и экспериментально полученными данными. Минимизация этой разницы осуществляется с использованием алгоритмов оптимизации, что позволяет модели извлекать $реологические параметры$, описывающие вязкоупругие свойства жидкости. В результате, модель обучается не просто аппроксимировать данные, а выявлять физически согласованные параметры, обеспечивающие надежные предсказания поведения жидкости в различных условиях течения.

Модель морского льда, основанная на DEM-симуляции, демонстрирует соответствие вычисленных профилей скорости (сплошные красные линии) и напряжений (пунктирные красные линии) данным DEM (маркеры) и профилям океанской скорости (синие линии) при различных концентрациях льда и максимальных скоростях океана.
Модель морского льда, основанная на DEM-симуляции, демонстрирует соответствие вычисленных профилей скорости (сплошные красные линии) и напряжений (пунктирные красные линии) данным DEM (маркеры) и профилям океанской скорости (синие линии) при различных концентрациях льда и максимальных скоростях океана.

Обеспечение физической согласованности и устойчивости

В основе фреймворка лежит принцип изотропной независимости от системы координат, фундаментальный физический принцип, гарантирующий, что выведенная реология материала не зависит от выбора системы отсчета. Это означает, что независимо от поворота или отражения системы координат, полученные характеристики вязкоупругого поведения вещества останутся неизменными. Математически, это обеспечивается инвариантностью тензорных величин, описывающих напряжения и деформации, относительно преобразований координат, что критически важно для физической корректности и обобщаемости модели. В рамках фреймворка, соблюдение данного принципа достигается за счет специальной формулировки оптимизационной задачи и соответствующих ограничений, обеспечивающих, что реологические параметры определяются исключительно свойствами материала, а не артефактами, связанными с выбором системы координат.

Для обеспечения корректности решаемой оптимизационной задачи и стабильности получаемых реологических моделей используется выпуклый потенциал диссипации. Математически, это означает, что функция диссипации $D(\mathbf{d})$ должна быть выпуклой по вектору скоростей деформации $\mathbf{d}$. Выпуклость гарантирует единственность решения задачи оптимизации и предотвращает возникновение нефизических или неустойчивых решений. Использование выпуклого потенциала диссипации является стандартной практикой в реологии и механике сплошных сред, обеспечивающей надежность и предсказуемость результатов моделирования.

Для повышения точности и эффективности реконструкции реологических свойств материалов используется комбинированная функция потерь, включающая как компоненту, основанную на поле напряжений, так и компоненту, основанную на поле скоростей. Функция потерь на основе напряжений ($L_{stress}$) минимизирует расхождение между предсказанными и измеренными напряжениями, в то время как функция потерь на основе скорости ($L_{velocity}$) минимизирует расхождение в распределении скорости. Совместное использование этих двух компонент позволяет максимально использовать всю доступную экспериментальную информацию и обеспечивает более надежную реконструкцию реологической модели, особенно в случаях, когда данные о напряжении и скорости получены из разных источников или имеют различную степень достоверности. Оптимизация комбинированной функции потерь ($L = \alpha L_{stress} + \beta L_{velocity}$, где $\alpha$ и $\beta$ – весовые коэффициенты) позволяет достичь баланса между соответствием предсказанных напряжений и скоростей экспериментальным данным.

Реализация предложенного подхода значительно упрощается благодаря использованию надежных программных фреймворков, таких как PyTorch и Firedrake. PyTorch обеспечивает эффективные вычисления на графических процессорах (GPU) и гибкость для разработки и обучения моделей. Firedrake, в свою очередь, предоставляет инструменты для решения задач вычислительной гидродинамики методом конечных элементов (МКЭ) и поддерживает высокопроизводительные вычисления на параллельных вычислительных системах. Комбинация этих фреймворков позволяет масштабировать вычисления для обработки больших объемов данных и сложных моделей, обеспечивая возможность анализа и моделирования реологического поведения материалов с высокой точностью и эффективностью. Оба фреймворка предоставляют автоматическую дифференциацию, что упрощает вычисление градиентов, необходимых для оптимизации параметров модели.

Оптимизация по закону Глена для ледяного покрова с использованием алгоритмов LBFGS (синий) и ADAM (красный) демонстрирует сходимость функций потерь скорости и напряжения при использовании полных пакетов данных.
Оптимизация по закону Глена для ледяного покрова с использованием алгоритмов LBFGS (синий) и ADAM (красный) демонстрирует сходимость функций потерь скорости и напряжения при использовании полных пакетов данных.

Влияние и перспективы развития подхода

Предложенная методика успешно воспроизводит известные конститутивные модели, такие как закон Глена, что подтверждает её способность к точному представлению существующих научных знаний о деформации льда. Восстановление известных моделей служит важным этапом валидации, демонстрируя, что разработанный подход не просто предлагает новые возможности, но и согласуется с уже установленными принципами реологии. Это особенно важно для надёжного моделирования поведения льда в климатических моделях, поскольку позволяет интегрировать проверенные закономерности с новыми параметрами и подходами, повышая общую точность и надёжность прогнозов, связанных с изменениями ледникового покрова и морского льда.

Разработанный инструментарий представляет собой мощный метод для определения реологических параметров как наземных, так и морских льдов. Точное определение этих параметров, описывающих деформацию и течение льда под воздействием различных сил, критически важно для повышения точности климатических моделей. Неверная оценка реологических свойств может приводить к значительным ошибкам в прогнозировании скорости таяния ледников и изменениях уровня моря. Предложенный подход позволяет более надежно оценивать эти свойства, учитывая сложное поведение льда и его зависимость от температуры и других факторов, что, в свою очередь, способствует созданию более реалистичных и достоверных прогнозов климатических изменений и их последствий.

Разработанная схема обладает значительной гибкостью, позволяющей учитывать влияние множества внешних параметров на реологические свойства льда и других сложных жидкостей. В частности, в модель можно интегрировать данные о температуре и содержании примесей, что критически важно для точного описания поведения льда в различных условиях окружающей среды. Учет этих факторов позволяет не только улучшить точность моделирования деформации и течения льда, но и расширить область ее применения, охватывая, например, исследование влияния загрязнений на прочность морского льда или зависимость реологических свойств от температурных градиентов в ледниках. Такая адаптивность делает схему особенно ценной для моделирования сложных геологических и климатических процессов, где реологические характеристики льда подвержены воздействию различных внешних сил и факторов.

В дальнейших исследованиях планируется проведение анализа чувствительности, направленного на оценку устойчивости полученных моделей к погрешностям и неопределенностям в исходных данных. Этот анализ позволит определить, насколько надежны выводы, сделанные на основе имеющихся наблюдений, и какие факторы оказывают наибольшее влияние на точность предсказаний. Кроме того, рамки, разработанные в данной работе, будут применены к изучению других сложных жидкостей, таких как полимерные растворы и гели, с целью расширения области их применимости и проверки универсальности подхода. Ожидается, что адаптация модели к различным типам материалов позволит углубить понимание реологических свойств и механизмов деформирования в широком спектре научных и промышленных областей, открывая новые возможности для разработки передовых материалов и технологий.

Анализ данных о напряжении и скорости льда позволил вывести закон Глена, несмотря на наличие шума, что подтверждается средними значениями (сплошные линии) и разбросом (область, ограниченная цветом) для десяти моделей, полученных из разных выборок шума.
Анализ данных о напряжении и скорости льда позволил вывести закон Глена, несмотря на наличие шума, что подтверждается средними значениями (сплошные линии) и разбросом (область, ограниченная цветом) для десяти моделей, полученных из разных выборок шума.

Представленное исследование демонстрирует стремление к математической точности в моделировании сложных систем, таких как ледники и морской лед. Авторы, подобно тому, как математик ищет фундаментальные законы, применяют нейронные сети для вывода реологических моделей, обеспечивая соответствие принципам изотропии и выпуклости потенциала диссипации. Этот подход перекликается с мыслью Исаака Ньютона: «Я не знаю, как я выгляжу в глазах мира, но, поскольку я прожил свою жизнь, я кажусь себе мальчиком, играющим на берегу моря, находящим ракушки и гальку, иногда находящим более гладкую гальку или более красивую ракушку, чем обычно, но никогда не находящим ничего, что могло бы унести его от поиска». В данном случае, нейронные сети – это инструменты поиска, а физически обоснованные модели – это «гладкие гальки», к которым стремится исследование, подтверждая, что корректность модели важнее, чем простое соответствие тестовым данным.

Что дальше?

Представленная работа, несомненно, представляет собой шаг вперед в построении реологических моделей из данных. Однако, следует признать, что истинная элегантность математического описания не в способности аппроксимировать экспериментальные данные, а в предсказательной силе, основанной на фундаментальных принципах. Проверка устойчивости полученных моделей к возмущениям и их экстраполяции за пределы исходного набора данных остается критически важной задачей. Нельзя полагаться на “черный ящик” нейронной сети, если не доказана его внутренняя согласованность с законами физики.

Перспективы дальнейших исследований очевидны: необходимо углубить понимание взаимосвязи между архитектурой нейронной сети и физическими свойствами моделируемой среды. Использование принципов инвариантности и симметрии должно стать неотъемлемой частью процесса обучения. Более того, следует исследовать возможность интеграции данных, полученных различными методами (например, дистанционного зондирования и непосредственных измерений), для повышения надежности и точности реологических моделей. Простое увеличение объема данных не решит проблему, если отсутствует строгое математическое обоснование.

В конечном счете, задача состоит не в том, чтобы создать сложную модель, которая “работает”, а в том, чтобы построить простую и понятную модель, которая описывает суть явления. Истинная ценность научного исследования заключается не в сложности, а в ясности и доказательности.


Оригинал статьи: https://arxiv.org/pdf/2511.10452.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-17 03:37