Циклические пептиды: новый подход к генерации конформаций

Автор: Денис Аветисян


Исследователи разработали метод, позволяющий эффективно создавать разнообразные и физически правдоподобные структуры циклических пептидов с использованием искусственного интеллекта.

"Покупай на слухах, продавай на новостях". А потом сиди с акциями никому не известной биотех-компании. Здесь мы про скучный, но рабочий фундаментал.

Бесплатный Телеграм канал
Разработана трехступенчатая схема MuCO, в которой генерация молекулярной структуры разделена на последовательное создание базового каркаса с использованием [latex]\mathrm{SE(3)}[/latex]-потокового соответствия, условную выборку боковых цепей посредством циклического RPE-потокового соответствия и физически обоснованную оптимизацию с применением силового поля Charmm36 для получения энергетически минимизированной конформации.
Разработана трехступенчатая схема MuCO, в которой генерация молекулярной структуры разделена на последовательное создание базового каркаса с использованием \mathrm{SE(3)}-потокового соответствия, условную выборку боковых цепей посредством циклического RPE-потокового соответствия и физически обоснованную оптимизацию с применением силового поля Charmm36 для получения энергетически минимизированной конформации.

Представлена платформа MuCO, использующая многоступенчатую оптимизацию конформаций на основе глубокого обучения и молекулярной динамики.

Моделирование циклизации пептидов, несмотря на важность для разработки новых лекарственных средств, затруднено разнообразием конформаций, не учитываемых традиционными подходами. В данной работе представлена методика MuCO: Generative Peptide Cyclization Empowered by Multi-stage Conformation Optimization, использующая многоступенчатую оптимизацию конформаций для генерации циклических пептидов. MuCO разделяет процесс на последовательное проектирование основной цепи, упаковку боковых цепей и физически обоснованную оптимизацию, что позволяет эффективно исследовать пространство конформаций. Способна ли данная методика стать ключевым инструментом в рациональном дизайне и исследовании свойств циклических пептидов?


Вызов конформационной сложности циклических пептидов

Предсказание трехмерных структур циклических пептидов остается серьезной проблемой в процессе разработки лекарственных препаратов из-за их конформационной сложности. Эти молекулы, в отличие от линейных пептидов, обладают ограниченной гибкостью, но при этом способны принимать множество различных конформаций, обусловленных как внутренними факторами — углом между пептидными связями, размером цикла — так и внешними, включая растворитель и взаимодействие с другими молекулами. Огромное количество возможных конформаций, в сочетании с наличием кольцевого напряжения, делает задачу моделирования исключительно сложной и требует разработки новых, более эффективных вычислительных методов для точного определения наиболее стабильных и биологически активных структур. Точное определение трехмерной структуры циклических пептидов необходимо для понимания механизмов их действия и оптимизации их терапевтических свойств.

Традиционные вычислительные методы испытывают значительные трудности при моделировании циклических пептидов из-за огромного числа возможных конформаций и внутренней напряженности кольца. Поскольку каждый атом в молекуле может принимать множество пространственных положений, количество потенциальных структур экспоненциально возрастает, что делает полный перебор невозможным даже для современных компьютеров. Более того, циклические пептиды часто содержат углы и связи, которые приводят к деформации молекулы и, как следствие, к высокой энергии, что усложняет поиск наиболее стабильной и биологически активной конформации. Эта проблема требует разработки новых подходов, способных эффективно исследовать конформационное пространство и учитывать как энергетические факторы, так и специфические взаимодействия, определяющие структуру и функцию этих молекул.

Точное моделирование конформаций циклических пептидов имеет первостепенное значение для понимания их биологической функции и оптимизации терапевтических свойств. Конформация, или трехмерная структура, определяет, как пептид взаимодействует с целевыми молекулами, такими как белки или рецепторы, и, следовательно, влияет на его активность. Неправильное предсказание конформации может привести к ошибочной оценке аффинности связывания, селективности и биодоступности потенциального лекарственного препарата. Поэтому, разработка надежных методов моделирования, способных учитывать сложность конформационного пространства и внутренние напряжения в циклических пептидах, является ключевым шагом в разработке новых и эффективных лекарственных средств, позволяя целенаправленно модифицировать структуру пептида для улучшения его фармакологических характеристик и повышения терапевтической эффективности.

Существующие методы моделирования, основанные исключительно на физических принципах, часто сталкиваются с серьезными вычислительными трудностями при изучении циклических пептидов. Проблема заключается в том, что точный расчет всех возможных конформаций и учет тонких межмолекулярных взаимодействий, определяющих стабильность и функцию этих соединений, требует огромных ресурсов. Традиционные подходы, хоть и опираются на фундаментальные законы физики, могут оказаться недостаточно эффективными для охвата всего спектра взаимодействий, включая ван-дер-ваальсовы силы, электростатические эффекты и специфические водородные связи, которые вносят значительный вклад в конформационную гибкость и биологическую активность циклических пептидов. В результате, полученные модели часто оказываются упрощенными и не отражают в полной мере реальное поведение молекул, что ограничивает их применимость в разработке лекарственных средств и понимании механизмов действия.

MuCO демонстрирует значительно более низкую потенциальную энергию и превосходит модели HighFold2 и EGNN в восстановлении нативных вторичных структур, таких как α-спирали, даже при использовании единственного образца.
MuCO демонстрирует значительно более низкую потенциальную энергию и превосходит модели HighFold2 и EGNN в восстановлении нативных вторичных структур, таких как α-спирали, даже при использовании единственного образца.

MuCO: Многоэтапная оптимизация конформации

Метод MuCO использует последовательный трехэтапный процесс для систематической оптимизации структуры циклических пептидов. На первом этапе генерируются различные правдоподобные конформации пептидного остова с использованием алгоритмов, таких как FoldFlow2 и Flow Matching. Второй этап посвящен размещению боковых цепей аминокислот, направленному на минимизацию стерических конфликтов и максимизацию благоприятных взаимодействий. Завершающий этап — оптимизация с учетом физических принципов, использующая силовое поле Charmm36 для достижения стабильной и реалистичной конформации.

Начальный этап MuCO использует методы, такие как FoldFlow2 и Flow Matching, для эффективной генерации разнообразных и правдоподобных конформаций пептидной цепи. FoldFlow2 и Flow Matching представляют собой алгоритмы диффузионных моделей, способные исследовать пространство конформаций, генерируя множество структурных вариантов, соответствующих физически разумным состояниям. Данные методы позволяют быстро получить широкий спектр начальных структур, необходимых для последующих этапов оптимизации, значительно сокращая время, необходимое для поиска стабильных и функционально значимых конформаций циклического пептида. Эффективность этих методов обусловлена их способностью эффективно исследовать пространство конформаций, избегая локальных минимумов энергии, что критически важно для достижения глобальной оптимизации структуры.

После генерации каркаса пептида, осуществляется подбор расположения боковых цепей аминокислот. Этот этап направлен на минимизацию стерических конфликтов между боковыми цепями и максимизацию благоприятных взаимодействий, таких как водородные связи и ван-дер-ваальсовы силы. Алгоритмы, используемые на данном этапе, исследуют различные конформации боковых цепей, стремясь найти оптимальное расположение, которое обеспечивает стабильность и функциональность циклического пептида. Эффективность подбора боковых цепей напрямую влияет на общую энергию и структурную достоверность конечной модели.

Финальная стадия оптимизации включает в себя использование физически обоснованного подхода, базирующегося на силовом поле Charmm36. Этот этап направлен на точную настройку структуры циклического пептида с учетом физических принципов, таких как минимизация энергии и соблюдение геометрических ограничений. Charmm36 позволяет учесть ван-дер-ваальсовы взаимодействия, электростатические силы и угловые деформации, что обеспечивает достижение стабильной и реалистичной конформации, соответствующей термодинамически благоприятному состоянию молекулы. Процесс оптимизации включает итеративное вычисление сил и моментов, действующих на атомы пептида, и соответствующее изменение их координат до достижения сходимости и минимизации энергии системы.

MuCO успешно генерирует пептидные структуры, демонстрируя способность к формированию двух различных типов циклизации: замыкания пептидной цепи и образования дисульфидных связей между цистеинами, что подтверждается визуализацией каркасов на первом этапе (cyan) и полными атомными моделями на последующих этапах (green).
MuCO успешно генерирует пептидные структуры, демонстрируя способность к формированию двух различных типов циклизации: замыкания пептидной цепи и образования дисульфидных связей между цистеинами, что подтверждается визуализацией каркасов на первом этапе (cyan) и полными атомными моделями на последующих этапах (green).

Интеграция глубокого обучения для усиления генерации остова

MuCO использует методы глубокого обучения, в частности, модели языков белков (PLM), такие как используемые в ESMFold, для направленной генерации белковых каркасов. Эти PLM, обученные на обширных наборах данных последовательностей белков, способны предсказывать правдоподобные структурные особенности и ускорять конформационный поиск. Интеграция PLM позволяет MuCO эффективно сужать пространство возможных структур, используя предварительные знания о вероятных конформациях, закодированные в параметрах модели. Это приводит к повышению скорости и точности генерации каркасов по сравнению с подходами, основанными исключительно на физико-химической оптимизации.

Языковые модели белков (PLM), обученные на обширных наборах данных последовательностей, способны предсказывать правдоподобные структурные характеристики белка, такие как вторичная структура и контакты между аминокислотами. Этот процесс основан на анализе статистических закономерностей, выявленных в огромном количестве известных белковых последовательностей. В результате, PLM позволяют значительно ускорить поиск конформации белка, сужая область поиска возможных структур и предоставляя вероятные начальные точки для более точной оптимизации, что снижает вычислительные затраты и время, необходимое для моделирования структуры белка.

Методы, такие как AlphaFold2 и его адаптации HighFold2 и AfCycDesign, служат ценными отправными точками и эталонами для валидации в процессе генерации структур белка. AlphaFold2 предоставляет предварительные модели, которые могут быть использованы в качестве начальных структур для дальнейшей оптимизации и уточнения в MuCO. HighFold2, оптимизированный для скорости, позволяет быстро генерировать множество начальных структур. AfCycDesign, специализирующийся на циклических белках, обеспечивает отправные точки для этой специфической категории молекул. Сравнение результатов MuCO с этими методами позволяет объективно оценить эффективность подхода и подтвердить достижение более низких значений потенциальной энергии по сравнению с существующими решениями.

Интеграция методов глубокого обучения и физически обоснованной оптимизации в MuCO позволяет достигать минимальной зарегистрированной потенциальной энергии для различных наборов данных. Данный подход объединяет способность моделей глубокого обучения, обученных на обширных последовательностях белков, к предсказанию правдоподобных структурных особенностей с точностью физических расчётов. В результате, MuCO демонстрирует стабильное превосходство над существующими базовыми моделями по показателю потенциальной энергии, что подтверждается сравнительными анализами на различных тестовых наборах данных.

В ходе анализа структурной достоверности MuCO успешно восстанавливает нативные α-α-спиральные мотивы и демонстрирует существенно более низкую потенциальную энергию (EE) по сравнению с базовыми моделями при однократной выборке.
В ходе анализа структурной достоверности MuCO успешно восстанавливает нативные α-α-спиральные мотивы и демонстрирует существенно более низкую потенциальную энергию (EE) по сравнению с базовыми моделями при однократной выборке.

Валидация и более широкие последствия для открытия лекарств

Метод MuCO подвергся тщательной проверке на соответствие действительности с использованием набора данных CPSea, что продемонстрировало его способность точно предсказывать конформации циклических пептидов, охватывая широкий спектр последовательностей. Данный набор данных, содержащий разнообразные структуры пептидов, позволил всесторонне оценить надежность MuCO в моделировании сложных молекулярных форм. Результаты валидации подтвердили высокую точность предсказаний MuCO, указывая на его потенциал как надежного инструмента для изучения конформационного пространства пептидов и прогнозирования их биологической активности. Способность метода точно моделировать конформации, независимо от аминокислотной последовательности, значительно расширяет возможности в области дизайна и разработки новых пептидных препаратов.

Метод MuCO демонстрирует значительное превосходство над традиционными подходами в предсказании конформаций циклических пептидов, как по точности, так и по вычислительным затратам. Это позволяет исследователям исследовать значительно более широкие конформационные пространства, что критически важно для обнаружения и разработки новых лекарственных средств. В отличие от методов, требующих больших вычислительных ресурсов и времени, MuCO обеспечивает эффективное и быстрое моделирование, открывая возможности для анализа большего числа пептидных последовательностей и выявления оптимальных структур с желаемыми свойствами. Такая возможность особенно важна на ранних стадиях разработки лекарств, где требуется быстрое прототипирование и скрининг большого количества потенциальных кандидатов.

Метод MuCO демонстрирует впечатляющую скорость работы при моделировании конформаций циклических пептидов. Зафиксированная амортизированная задержка в 40.5 миллисекунд на образец и способность генерировать ансамбль из ста образцов всего за 4.054 секунды значительно превосходят показатели, достижимые с использованием методов, основанных на AlphaFold2. Такая высокая производительность открывает возможности для масштабного исследования конформационного пространства пептидов, что особенно важно при разработке новых лекарственных препаратов, где требуется быстрая оценка множества возможных структур для оптимизации их свойств и селективности.

Метод MuCO предоставляет исследователям надежный и эффективный инструмент для предсказания конформаций циклических пептидов, что значительно ускоряет процесс разработки новых лекарственных препаратов на их основе. Возможность быстро и точно определять трехмерную структуру пептидов позволяет оптимизировать их взаимодействие с целевыми молекулами, повышая как эффективность, так и селективность будущих лекарств. Такой подход особенно важен при создании препаратов, требующих высокой специфичности действия и минимальных побочных эффектов, поскольку позволяет точно настраивать структуру пептида для достижения оптимального терапевтического эффекта. В результате, MuCO открывает новые перспективы в области пептидной фармакологии, способствуя созданию более мощных и безопасных лекарственных средств.

Модель MuCO демонстрирует превосходную способность поддерживать разнообразие вторичной структуры и значительно улучшает восстановление регулярных элементов, таких как α-спирали и β-листы, по сравнению с другими методами.
Модель MuCO демонстрирует превосходную способность поддерживать разнообразие вторичной структуры и значительно улучшает восстановление регулярных элементов, таких как α-спирали и β-листы, по сравнению с другими методами.

Представленная работа демонстрирует элегантный подход к задаче генерации конформаций циклических пептидов, разделяя сложный процесс на последовательные этапы: генерацию основной цепи, упаковку боковых цепей и физически обоснованную оптимизацию. Такой модульный дизайн позволяет добиться высокой эффективности и реалистичности результатов. Как отмечал Карл Поппер: «Нельзя чинить одну часть, не понимая целого». В данном исследовании это проявляется в осознанном стремлении к целостному пониманию конформационного пространства пептидов, а не к изолированному решению отдельных подзадач. Декомпозиция на этапы, предложенная в MuCO, позволяет более эффективно оптимизировать каждый аспект конформации, что соответствует принципу системного подхода к сложным биологическим задачам.

Куда Ведет Путь?

Представленная работа, безусловно, демонстрирует элегантность подхода к генерации конформаций циклических пептидов. Однако, как часто бывает, решение одной задачи неизбежно обнажает новые. Разделение процесса на этапы — разумный ход, но возникает вопрос: не является ли эта ступенчатость упрощением, искусственным ограничением гибкости молекулярной системы? Каждая новая зависимость, введённая для контроля, — это скрытая цена свободы, и необходимо тщательно оценить, не приводит ли это к упущению важных конформационных состояний.

Очевидным направлением дальнейших исследований представляется интеграция MuCO с более детализированными моделями физики, учитывающими, например, явный учет сольватации или динамические эффекты. Простота модели — это достоинство на данном этапе, но для предсказания биологической активности необходима более полная картина. Не менее важным представляется расширение области применения — от циклических пептидов к более сложным макроциклическим структурам, где проблема конформационного поиска становится еще более острой.

В конечном счете, успех подобных методов будет определяться не только точностью предсказаний, но и способностью адаптироваться к непредсказуемости биологических систем. Структура определяет поведение, но поведение, в свою очередь, может изменить структуру. Понимание этой обратной связи — ключ к созданию действительно интеллектуальных систем для дизайна пептидов.


Оригинал статьи: https://arxiv.org/pdf/2602.11189.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2026-02-14 22:47