35 тысяч новых откликов в сутки. Рассказываем, как мы улучшили алгоритмы умного поиска

В поиск hh.ru заходит около 2 млн пользователей по будням и около 1 млн — по выходным. Каждому из них нужно откликнуться в среднем 6 раз, чтобы получить приглашение на собеседование (летом стало достаточно всего около 4,2 раза), и пройти как минимум несколько собеседований, чтобы найти работу.

В поиск hh.ru заходит около 2 млн пользователей по будням и около 1 млн — по выходным. Каждому из них нужно откликнуться в среднем 6 раз, чтобы получить приглашение на собеседование (летом стало достаточно всего около 4,2 раза), и пройти как минимум несколько собеседований, чтобы найти работу.

Общее количество откликов зависит от того, что показывает и присылает кандидатам умный поиск. Чем более подходящие вакансии видят соискатели, тем больше откликов делают. Поэтому мы постоянно улучшаем алгоритмы поиска. В июле мы доработали две модели, которые принесли больше 31 тысячи новых откликов в сутки.

1. Стали лучше учитывать, какая доля соискателей, просмотревших вакансию за неделю, откликнулась на нее. Это принесло 20,6 тысячи новых откликов в сутки.

2. Стали лучше прогнозировать, что сделал бы кандидат с вакансией, даже если он ее никогда не видел. Благодаря этому улучшилось качество поиска, а вакансии работодателей получают около 14,5 тысячи дополнительных откликов в сутки.

Как это работает?

Каждый день мы выгружаем из логов исторические данные о поведении пользователей за последние 6 дней.

Получается огромная матрица наподобие такой:

35 тысяч новых откликов в сутки. Рассказываем, как мы улучшили алгоритмы умного поиска

Но эта матрица содержит только то, что мы уже знаем. Чтобы начать предлагать пользователю интересные ему вакансии, нужно научиться прогнозировать его реакцию на те объявления, которые он еще не видел.

Для этого мы попробовали применить алгоритм Alternating Least Square(ALS). Преобразовали эту матрицу в две, X и Y. Получается, например, такая матрица X:

35 тысяч новых откликов в сутки. Рассказываем, как мы улучшили алгоритмы умного поиска

И, например, такая матрица Y:

35 тысяч новых откликов в сутки. Рассказываем, как мы улучшили алгоритмы умного поиска

Прикладные свойства преобразования ALS такие, что, если теперь перемножить матрицы X и Y, в приближении к матрице R, получаются прогнозы действий пользователей с вакансиями, которые он мог еще не видеть. За счет свойства алгоритма ALS делать прогнозы растет качество рекомендаций.

35 тысяч новых откликов в сутки. Рассказываем, как мы улучшили алгоритмы умного поиска

Дальше мы учим модели для рекомендации вакансий, которые в качестве одного из метапризнаков берут такой прогноз. Затем применяем их в production:

35 тысяч новых откликов в сутки. Рассказываем, как мы улучшили алгоритмы умного поиска

Что это значит для работодателя?

Работа — предмет тщательного выбора, который делает человек. Конверсия из показов вакансии в просмотры и отклики зависит от того, насколько хорошо условия и требования работодателя выглядят на фоне других вакансий, подходящих тем же кандидатам.

Поэтому основная часть дополнительных откликов распределяется по вакансиям с хорошими условиями, и они быстрее закрываются. Разумеется, продолжают работать и премиальный статус, и время обновления, которое дает преимущества вакансиям «Стандарт+», и реклама вакансий в Clickme. Но они больше влияют на показы вакансии на выдаче, чем на конечное решение пользователя просмотреть вакансию и откликнуться на нее.

Вакансии с не очень хорошими условиями могут получить большое количество откликов, только если все вакансии с более привлекательными условиями уже получили много резюме. Тогда работодатели либо сами снимают такую вакансию с публикации, либо перестают обрабатывать новые отклики, и через неделю популярная раньше вакансия автоматически резко теряет позиции в поисковой выдаче. Но вряд ли на это можно рассчитывать, потому что появляются работодатели с новым интересным для соискателей предложением.

Создавайте вакансии с хорошими условиями (мы уже рассказывали, как), публикуйте их правильно, и умный поиск с машинным обучением и учетом поведения похожих пользователей даст еще больше откликов от подходящих кандидатов!