Умный хедхантинг Компания HeadHunter запатентовала компоненты технологии «умного» поиска сайта hh.ru для рекомендации резюме и вакансий. В качестве патентообладателя изобретения указано ООО «Хэдхантер», авторами указаны Георгий Даньщин, Виктор Реушкин и Александр Сидоров. Патентная заявка к изобретению под названием «Рекомендательная система подбора персонала с использованием машинного обучения и с понижением размерности многомерных данных и способ подбора персонала с использованием машинного обучения и с понижением размерности многомерных данных» опубликована за №2019107661 на сайте Федеральной службы по интеллектуальной собственности (Роспатент). Как рассказал CNews Александр Сидоров, руководитель направления анализа данных компании HeadHunter и один из изобретателей технологии, запуск запатентованных технологий в рамках умного поиска hh.ru был произведен во второй половине 2019 г., однако разработка проекта продолжалась на протяжении нескольких лет, начиная с 2017 г. Патентная заявка описывает изобретение как специализированную систему для поиска вакансий и резюме «в рекомендательных системах подбора персонала с большим количеством записей в базах данных». Суть изобретения сводится к применению особого алгоритма сжатия данных из резюме и вакансий с минимальной потерей смысла. Это значительно ускоряет их обработку, обеспечивая при этом выборку релевантных по тексту и смыслу документов из миллионов резюме и сотен тысяч вакансий за сотни миллисекунд. Отобранные таким образом данные применяются для ускоренного предварительного отбора вакансий и резюме, и затем с помощью моделей машинного обучения производится точный отбор подходящих кандидатов. Запатентованный умный поиск внедрен в hh.ru в 2019 г. Изобретение используется как для обработки запросов работодателей при поиске в базе резюме, так и для обработки запросов соискателей при поиске вакансий. Изобретение hh.ru предлагает автоматизированный поиск релевантных документов для рекомендательного подбора персонала с машинным обучением и с понижением размерности многомерных данных. Алгоритм понижает размерности части векторного представления текста и смысловых категорий в вакансии и резюме до последовательностей из нескольких битов, составляет из них LSH-хеши (Locality-sensitive hashing — вероятностный метод для понижения размерности многомерных данных). Так удается экономить расход машинного времени без снижения качества рекомендаций и количества откликов. Источник: Роспатент Алгоритм hh.ru уменьшает размерности векторов терминов и использует их как признаки для ансамблей решающих деревьев. По словам Александра Сидорова, обучение представляет собой перманентный процесс, который подразумевает улучшение алгоритмов умного поиска за счет постоянно обновляемой базы данных. Эффективность и перспективы технологии Как отмечено в пояснительной записке к патенту, отказ от изобретения снизил бы число откликов на вакансии примерно на 5%, при этом рекомендованные резюме для 75% вакансий появлялись бы на сутки позже, а не сразу после создания вакансии. За счет экономии времени пользователей и вычислительных мощностей, алгоритм позволяет внедрять сложные модели машинного обучения для более качественных рекомендаций.CNews