...

Машинное обучение упрощает процесс получения более качественных белков

от Sova-kolhoz

Система искусственного интеллекта предсказывает, как будут функционировать белки с несколькими взаимодействующими мутациями

Machine learning streamlines the complexities of making better proteins

Новая платформа машинного обучения под названием MULTI-evolve значительно упрощает процесс разработки белков.

Для создания высокоэффективных белков для лекарств или потребительских товаров требуется множество изменений, экспериментов и доводки. Новая платформа машинного обучения позволяет вместить все это в один раунд тестирования.

Технология, называемая MULTI-evolve, предсказывает, как поведут себя белки, если заменить несколько их аминокислот на другие. Исследователи сообщают в журнале Science от 19 февраля, что MULTI-evolve сочетает лабораторные эксперименты с машинным обучением, чтобы найти эти усовершенствованные белки.

Специально разработанные белки играют важную роль в производстве повседневных продуктов, таких как лекарства, биотопливо и даже стиральные порошки. Ученым обычно приходится заменять несколько аминокислот в процессе разработки, чтобы повысить эффективность белка. Но замена одной аминокислоты другой может изменить то, как следующая замена повлияет на функцию белка, поэтому поиск комбинаций замен, которые хорошо сочетаются друг с другом, часто требует многократных модификаций и лабораторных тестов. “Это очень сложная задача поиска, в которой мы эффективно угадываем и проверяем”, — говорит Патрик Хсу, биоинженер из Калифорнийского университета в Беркли и Института Arc в Пало-Альто, Калифорния.

Хсу и его коллеги разработали многоуровневый рабочий процесс, чтобы исключить большинство таких итераций и предсказать высокоэффективные белки с несколькими заменами, или мутациями, за один раунд тестирования. Для этого им нужна была информация о том, как различные мутации влияют друг на друга. Для каждого белка, на который нацелилась команда, рабочий процесс состоял из трех этапов. Сначала исследователи использовали либо предыдущие данные, либо методы машинного обучения, чтобы предсказать, как замена отдельных аминокислот повлияет на функцию белка. Затем, чтобы установить, как мутации взаимодействуют друг с другом, они создали в лаборатории серию белков, каждый из которых содержал по две такие мутации, и проверили, насколько хорошо работает каждый из них. Наконец, они обучили модель машинного обучения на основе этих лабораторных данных и попросили ее предсказать, насколько хорошо целевой белок будет функционировать при пяти или более мутациях.

Команда протестировала MULTI-evolve на трех белках, включая антитело, относящееся к аутоиммунным заболеваниям, и белок, используемый для редактирования генов CRISPR. В каждом случае модель выявляла несколько комбинаций мутаций, которые в лабораторных тестах превосходили исходные белки, что позволяет предположить, что модель может выбрать набор изменений, которые хорошо сочетаются друг с другом.

Среди множества белковых задач, которые MULTI-evolve может упростить, Хсу выделил две: использование одного белка для отслеживания перемещения другого внутри клетки и создание более совершенной генной терапии для людей, чей организм не вырабатывает определенные ферменты. “Мы в восторге от этой работы”, — говорит Хсу. “Я думаю, что существует огромный интерес к тому, как это на самом деле меняет научную практику”.

Похожие публикации