Российские учёные создали ИИ для ускорения аннотации геномов животных, микробов и растений
Система ИИ находит гены в ДНК любых организмов.
Исследователи из Института искусственного интеллекта AIRI, Института цитологии и генетики СО РАН и Университета «Сириус» разработали нейросетевую модель, которая помогает быстро размечать ДНК — находить гены, их границы и внутреннюю структуру. Как сообщили в пресс-службе AIRI, разработка ускорит изучение геномов миллионов организмов, для которых пока нет подробных данных.
Сегодня новые геномы собираются быстрее, чем учёные успевают их аннотировать. Подготовка качественной разметки может занимать годы. Например, из 4,5 тысяч известных видов млекопитающих частично аннотированы только 166. Схожая ситуация и с другими организмами, сообщает ТАСС.
Созданная система состоит из нескольких нейросетей, каждая из которых отвечает за свой этап. Сначала алгоритм ищет возможные начала и концы генов, затем проверяет, действительно ли найденный участок является геном, определяет его тип и уточняет структуру. Модель умеет находить не только белок-кодирующие гены, но и те, которые регулируют работу других генов. Тесты показали, что система хорошо работает не только с геномами млекопитающих, на которых обучалась, но и с дрозофилами, растениями и дрожжами. Учёные надеются, что она сможет эффективно анализировать геномы всех живых организмов, что значительно ускорит их изучение.