Kraken 2 — это система таксономической классификации последовательностей ДНК, являющаяся усовершенствованной версией оригинального Kraken. Она использует точные совпадения k-меров для достижения высокой точности и скорости классификации. В отличие от предыдущей версии, Kraken 2 значительно снижает потребление памяти и ускоряет процесс построения баз данных, что делает её более эффективной для анализа метагеномных данных.
Основной принцип работы Kraken 2 заключается в использовании минимизаторов (l-меров) вместо полных k-меров для индексации референсных данных. Это позволяет существенно уменьшить размер базы данных и ускорить процесс классификации. Кроме того, Kraken 2 поддерживает работу с белковыми базами данных и 16S рРНК базами, такими как Greengenes, SILVA и RDP, что расширяет её возможности в области вирусной и бактериальной метагеномики.
- Снижение потребления памяти: Использование минимизаторов вместо полных k-меров позволяет снизить размер базы данных примерно на 85% по сравнению с Kraken 1, что делает Kraken 2 более подходящей для работы с большими референсными наборами данных.
 - Ускорение классификации: Благодаря оптимизации структуры данных и использованию компактных хеш-таблиц, Kraken 2 обеспечивает более быструю классификацию последовательностей.
 - Поддержка белковых баз данных: Kraken 2 может работать с базами данных, построенными на аминокислотных последовательностях, выполняя шестирамочную переведённую проверку запросов.
 - Поддержка 16S рРНК баз данных: Kraken 2 совместима с базами данных 16S рРНК, такими как Greengenes, SILVA и RDP, что расширяет её применение в области микробиологии.
 - Интеграция с Bracken: Kraken 2 совместима с инструментом Bracken, который позволяет оценивать относительное количество видов или родов в метагеномных выборках.
 - Поддержка вирусной метагеномики: Благодаря улучшенной чувствительности и точности, Kraken 2 предоставляет более надёжные результаты при анализе вирусных данных.