Задача ранжирования состоит в упорядочении документов коллекции по убыванию степени их соответствия запросу, т.е. более релевантные (адекватные) документы должны занимать более высокие позиции в выдаче. Для решения этой, основной задачи поиска, большинство поисковых систем используют «функции релевантности» (способ получить числовую оценку соответствия документа запросу). Другими словами, поисковая программа вычисляет значение релевантности документа в контексте запроса и сортирует коллекцию согласно данному числу.
Как правило, релевантность является функцией от набора переменных (их ещё называют факторами). В качестве факторов выступают различные числовые характеристики, которые должны помогать различать релевантные документы и нерелевантные. Для многих поисковых систем результирующая функция релевантности является простой комбинацией небольшого множества (от 5-15 штук) факторов. Некоторые более комплексные факторы используются сами в качестве самостоятельных функций ранжирования.
Подход крупнейших поисковых систем Yandex и Google использует значительно большее количество факторов — ранжирование коллекции (тестовых) основано на более чем 150 компонентах.
Большинство из факторов представляют собой простые числовые характеристики документа или запроса. Ключевым моментом в построении ранжирования является способ комбинации факторов, т.е. вид функции релевантности. Для получения функции ранжирования используются методы машинного обучения.
Такой подход позволяет достаточно легко добавлять новые ранжирующие факторы, тем самым развивая и улучшая поисковую систему.
Главные факторы ранжирования
Количество факторов не является неизменяемой константой или сколько-нибудь фиксированным числом. Поисковая система Google, к примеру, при ранжировании абсолютно не учитывает мета-тэг «keywords», хотя ранее, на него возлагались определённые функции в определении результатов поиска и их региональной принадлежности.
В случае, если вы являетесь пользователем сервиса «поиск по сайту» (скажем Яндекс.Сервер), то при ранжировании страниц с одного вашего сайта, многие факторы также отбрасываются. Так как всеми факторами ранжирования являются свойства текста документа и поискового запроса (без учёта внешних ссылок на страницы).
Поиск ведётся в данном случае по следующим основным критериям:
Точное совпадение запроса и фрагмента текста
Полное вхождение запроса в заголовок страницы
Язык запроса документа
Поиск соответствующих документов и упорядочивание их с помощью различных «яндексовских» модификаций специализированной математической формулы ранжирования Okapi BM25
Также в качестве факторов ранжирования интернет сайтов выступают:
Отношение числа ссылок точно содержащих запрос, к общему числу ссылок
Логарифм от числа внешних ссылок на страницу (можно напомнить читателю, что логарифм довольно быстро «насыщающиеся» функция, т.е. её производная быстро уменьшается с ростом аргумента)
Полный список критериев, а также конкретный вид модифицированной формулы ранжирования Okapi BM25, был и остаётся главным коммерческих секретом крупных поисковых систем. Это связано с постоянным желанием оптимизаторов воздействовать на алгоритмы ранжирования (для поискового продвижения сайтов) максимально эффективно.
Продвижение по трафику: вопрос...
Ряд вопросов по продвижению сайта по трафику. Нюансы тарификации, расчёта стоимости работ, абонентской оплаты.
31 мая
Белая оптимизация и черная пои...
Что такое «черная» и «белая» поисковая оптимизация? Каковы критерии? Базовые фильтры поисковых систем.
31 мая
Способы тестирования сайта
Как происходит тестирование и отладка после завершения работ по созданию сайта?
31 мая
Обновление сайта в процессе пр...
Зачем осуществлять регулярное обновление сайта (новости и статьи)? Важно ли обновление сайта для его успешного поискового продвижения в сети
Чем обязательно уметь управлят...
Какими параметрами на странице и на сайте требуется обязательно уметь управлять для эффективного продвижения сайта в поисковых системах Яндекс и Google?
31 мая
Базовые требования к макету ди...
Изложены базовые требования от SEO-специалистов по дизайну сайта. Требования к программной части сайта формулируются отдельно.
31 мая
Изменение алгоритмов поисковых...
Плановые изменения алгоритмов ранжирования в поисковых системах. Региональная формула ранжирования и секреты алгоритмов.
Правила использования копирайт...
Как правильно использовать копирайты компании «Пиксель Плюс» для размещения на сайте? С какого слова указывать ссылку? Подчеркивать или не подчеркиват...
31 мая
Продвижение по трафику: вопрос...
Ряд вопросов по продвижению сайта по трафику. Нюансы тарификации, расчёта стоимости работ, абонентской оплаты.
31 мая
Белая оптимизация и черная пои...
Что такое «черная» и «белая» поисковая оптимизация? Каковы критерии? Базовые фильтры поисковых систем.
31 мая
Способы тестирования сайта
Как происходит тестирование и отладка после завершения работ по созданию сайта?
31 мая
Обновление сайта в процессе пр...
Зачем осуществлять регулярное обновление сайта (новости и статьи)? Важно ли обновление сайта для его успешного поискового продвижения в сети
Советы по составлению ТЗ на со...
Что нужно в первую очередь от клиента при разработке технического задания для создания интернет-магазина?
31 мая
Сравнение CMS 1С-Битрикс и Joomla
Какую системы управления выбрать? Чем коммерческие системы управления отличаются от бесплатных? Что лучше 1С-Битрикс или Joomla?
Стандартные цвета для дизайна ...
Стандартные цвета для веб-дизайна. Используя эти цвета для своих сайтов в интернете вы можете быть уверены в правильной цветопередаче и их восприятии ...
Принципиально новые условия сотрудничества в SEO — зарабатываем только вместе!
Уникальный тариф «Оборот», где доход агентства больше не зависит от визитов и позиций вашего сайта, а привязан исключительно к росту оборота вашей компании.
Максимальное погружение агентства в нюансы вашего бизнеса, конкурентного окружения и тематики.
Самый прозрачный показатель эффективности, который нельзя «накрутить».
Идеально подходит для интернет-магазинов и сайтов услуг с возможностью масштабирования.
Минимальная фиксированная часть оплаты — от 79 500 рублей.
Тариф, который хотели сделать многие, но реализовали только мы.