ConcepT — это система майнинга концептов, ориентированная на пользователя, разработанная компанией Tencent для анализа запросов и документов в браузере Tencent QQ. В отличие от традиционных методов, которые извлекают абстрактные и универсальные концепты из статичных источников, таких как Википедия, ConcepT ориентируется на реальные пользовательские запросы и клики, что позволяет выявлять концепты, соответствующие интересам и языковому стилю пользователей. Это делает систему особенно эффективной для задач, связанных с поиском и рекомендациями контента.
Система ConcepT была внедрена в браузер Tencent QQ, который является одним из самых популярных мобильных браузеров в Китае с более чем 110 миллионами активных пользователей. В процессе работы ConcepT анализирует большие объемы данных, включая запросы пользователей и их взаимодействия с контентом, чтобы выявить концепты, которые затем используются для улучшения качества поиска и рекомендаций новостных лент. Результаты A/B-тестирования показали, что использование концептов, ориентированных на пользователя, повысило эффективность отображения контента на 6,01%.
- Анализ пользовательских запросов и кликов: Извлечение концептов на основе реальных взаимодействий пользователей с контентом.
 - Динамическое обновление концептов: Постоянное обновление базы концептов для отражения текущих интересов пользователей.
 - Точная маркировка документов: Присваивание документам соответствующих концептов для улучшения их понимания и классификации.
 - Построение иерархической таксономии: Создание структуры "тема-концепт-экземпляр" для организации и представления знаний.
 - Улучшение качества поиска и рекомендаций: Повышение релевантности результатов поиска и рекомендаций новостных лент за счет использования пользовательских концептов.
 - Поддержка китайского языка: Адаптация системы для обработки запросов и документов на китайском языке, с возможностью переноса технологий на другие языки.