Искусственный интеллект предсказывает работу ферментов лучше, чем ведущие инструменты
Новый инструмент искусственного интеллекта может предсказывать функции ферментов на основе их аминокислотных последовательностей, даже если ферменты не изучены или плохо поняты. Исследователи заявили, что инструмент искусственного интеллекта, получивший название CLEAN, превосходит ведущие современные инструменты по точности, надежности и чувствительности. Лучшее понимание ферментов и их функций было бы благом для исследований в области геномики, химии, промышленных материалов, медицины, фармацевтики и многого другого.
"Точно так же, как ChatGPT использует данные письменного языка для создания прогнозирующего текста, мы используем язык белков для прогнозирования их активности", - сказал руководитель исследования Хуэймин Чжао, профессор химической и биомолекулярной инженерии Иллинойского университета Урбана-Шампейн. "Почти каждый исследователь, работая с новой последовательностью белка, хочет сразу же узнать, что делает этот белок. Кроме того, при изготовлении химических веществ для любого применения - биологии, медицины, промышленности - этот инструмент поможет исследователям быстро определить подходящие ферменты, необходимые для синтеза химических веществ и материалов".
Исследователи опубликуют свои результаты в журнале Science и сделают CLEAN доступным онлайн 31 марта.
Благодаря достижениям в области геномики многие ферменты были идентифицированы и секвенированы, но у ученых практически нет информации о том, что делают эти ферменты, сказал Чжао, сотрудник Института геномной биологии Карла Р. Везе в Иллинойсе.
Другие вычислительные инструменты пытаются предсказать функции ферментов. Как правило, они пытаются присвоить энзиму регистрационный номер - идентификационный код, который указывает, какую реакцию катализирует фермент, - сравнивая запрошенную последовательность с каталогом известных ферментов и находя похожие последовательности. Однако, по словам Чжао, эти инструменты не работают так хорошо с менее изученными или нехарактерными ферментами, а также с ферментами, которые выполняют множество функций.
"Мы не первые, кто использует инструменты искусственного интеллекта для прогнозирования количества комиссионных ферментов, но мы первые, кто использует этот новый алгоритм глубокого обучения, называемый контрастивным обучением, для прогнозирования функции фермента. Мы обнаружили, что этот алгоритм работает намного лучше, чем инструменты искусственного интеллекта, которые используются другими", - сказал Чжао. "Мы не можем гарантировать, что каждый продукт будет правильно спрогнозирован, но мы можем получить более высокую точность, чем при использовании двух или трех других методов".
Исследователи проверили свой инструмент экспериментально, как в вычислительных экспериментах, так и в экспериментах in vitro. Они обнаружили, что инструмент не только может предсказать функцию ранее нехарактерных ферментов, он также исправляет ферменты, неправильно помеченные ведущим программным обеспечением, и правильно идентифицирует ферменты с двумя или более функциями.
Группа Чжао делает CLEAN доступным онлайн для других исследователей, стремящихся охарактеризовать фермент или определить, может ли фермент катализировать желаемую реакцию.
"Мы надеемся, что этот инструмент будет широко использоваться широким исследовательским сообществом", - сказал Чжао. "С помощью веб-интерфейса исследователи могут просто ввести последовательность в поле поиска, как в поисковой системе, и увидеть результаты".
Чжао сказал, что группа планирует расширить ИИ, лежащий в основе CLEAN, для характеристики других белков, таких как связывающие белки. Команда также надеется на дальнейшую разработку алгоритмов машинного обучения, чтобы пользователь мог искать желаемую реакцию, а искусственный интеллект указывал бы на подходящий для этой работы фермент.
"Существует множество нехарактерных связывающих белков, таких как рецепторы и факторы транскрипции. Мы также хотим предсказать их функции", - сказал Чжао. "Мы хотим предсказать функции всех белков, чтобы мы могли знать все белки, которые есть в клетке, и лучше изучать или проектировать целую клетку для биотехнологических или биомедицинских применений".
Национальный научный фонд поддержал эту работу через институт Molecule Maker Lab, исследовательский институт искусственного интеллекта, которым руководит Чжао.
Дополнительная информация: https://moleculemaker.org/alphasynthesis/