ConcepT

Бесплатно

Сайт: arxiv.org/abs/1905.08487

ConcepT — это система майнинга концептов, ориентированная на пользователя, разработанная компанией Tencent для анализа запросов и документов в браузере Tencent QQ. В отличие от традиционных методов, которые извлекают абстрактные и универсальные концепты из статичных источников, таких как Википедия, ConcepT ориентируется на реальные пользовательские запросы и клики, что позволяет выявлять концепты, соответствующие интересам и языковому стилю пользователей. Это делает систему особенно эффективной для задач, связанных с поиском и рекомендациями контента.

Система ConcepT была внедрена в браузер Tencent QQ, который является одним из самых популярных мобильных браузеров в Китае с более чем 110 миллионами активных пользователей. В процессе работы ConcepT анализирует большие объемы данных, включая запросы пользователей и их взаимодействия с контентом, чтобы выявить концепты, которые затем используются для улучшения качества поиска и рекомендаций новостных лент. Результаты A/B-тестирования показали, что использование концептов, ориентированных на пользователя, повысило эффективность отображения контента на 6,01%.

  • Анализ пользовательских запросов и кликов: Извлечение концептов на основе реальных взаимодействий пользователей с контентом.
  • Динамическое обновление концептов: Постоянное обновление базы концептов для отражения текущих интересов пользователей.
  • Точная маркировка документов: Присваивание документам соответствующих концептов для улучшения их понимания и классификации.
  • Построение иерархической таксономии: Создание структуры "тема-концепт-экземпляр" для организации и представления знаний.
  • Улучшение качества поиска и рекомендаций: Повышение релевантности результатов поиска и рекомендаций новостных лент за счет использования пользовательских концептов.
  • Поддержка китайского языка: Адаптация системы для обработки запросов и документов на китайском языке, с возможностью переноса технологий на другие языки.
Подробнее