Заказать звонок
Главная » ссылки » Статьи о сайтах » «Королёв»: новый поисковый алгоритм Яндекса

«Королёв»: новый поисковый алгоритм Яндекса

В августе 2017 года Яндекс объявил о запуске нового поискового алгоритма «Королёв». В основе поиска заложен принцип искусственного интеллекта. Нейросети помогают российскому поисковику точнее отвечать на сложные пользовательские запросы: анализируется введенный вопрос и содержание страниц.

Почему так назвали?

Основоположник космонавтики С. П. Королев сделал возможным полет человека в космос. У Яндекса тоже есть мечта — сделать поиск, который понимает. Первое — огромный технологический прорыв в космонавтике. Второе, не менее важный технологический прорыв на пути к смысловому поиску.

Как было раньше

Первые поисковые системы появились в конце ХХ века. Тогда количество сайтов исчислялось тысячами, а интернет был достаточно редким явлением даже на слуху. Чтобы человек нашел искомое, поисковой системе достаточно было лишь составить список веб-документов, где встречаются подобные слова. В поиск был заложен тезис: больше ключевых фраз в документе, выше ранжируется страница в поиске.

С развитием интернета развивались и поисковые системы: они начали учитывать географическое положение, ссылки, поисковики стали учитывать и поведение пользователей. Наступил такой момент, когда условий для ранжирования набралось так много, учитывать их все стало невозможным. В Яндексе поняли — лучше обучить машину самой анализировать признаки ранжирования и в зависимости от ситуации выборочно учитывать какие-то из них. Через время был разработан метод машинного обучения — MatrixNet.

На пути к «Королёву»

После запуска MatrixNet поиск по-прежнему опирался на слова: подбирался список подходящих веб-документов, на которых встречаются слова из запроса, а потом применялась формула ранжирования. Этого было недостаточно, поскольку страница могла не содержать нужного количества слов из запроса, но при этом она полно отвечала на пользовательский запрос.

Большим шагом на пути к смысловому поиску стал запуск алгоритма «Палех», в основу которого была положена нейросеть. Этот алгоритм научился сопоставлять заголовки и поисковые запросы: чем больше сходства, тем ближе по смыслу запрос и заголовок.

Как стало после запуска алгоритма?

«Королёв» пошел еще дальше: он научился сравнивать не только запросы и заголовки, но и всю страницу целиком. Для этого нейронная сеть преобразует тексты страниц и поисковые запросы в семантические векторы, на это требуются много ресурсов. Чтобы понять, как это, приведем пример.

«Палех» анализировал пользовательский запрос и заголовки страниц. Чтобы ему «прочитать» заголовок документа и поисковый запрос, не нужно много времени. «Королёв» «читает» не только заголовок, но и всю страницу целиком: одно дело прочитать название книги и примерно понять, о чем она, другое дело прочитать всю книгу целиком, чтобы узнать подробности. Сколько на это потребуется ресурсов? Много больше.

[фильм в котором конец света но космонавты всех спасают]

Именно поэтому новый «космический» алгоритм анализирует запрос и смысл страницы не в режиме «здесь и сейчас», когда пользователь вводит вопрос, а заранее, в процессе индексации страницы. Когда человек пишет запрос, алгоритм сопоставляет его с уже изученными страницами. Нейросеть в «Палехе» подключается на последнем этапе ранжирования — смысловому анализу подвергаются 150 отобранных страниц. «Королёв» подключает смысловой анализ гораздо раньше, поэтому количество страниц доходит до 200 000, поясняют в Яндексе.

В обучении машин участвуют пользователи Яндекса

Важно сказать о том, что принцип машинного обучения построен, в том числе и на привлечении пользовательского опыта. Люди, которые ищут ответы на свои вопросы в интернете, дают поисковой системе опыт, положительный и отрицательный. Если человек ввел запрос и остался на выбранной странице долго, значит, он нашел там то, что искал. Если же он быстро закрыл страницу, значит, она не была релевантной запросу. Так в машинном обучении участвуют и обычные пользователи.

Что значит новый алгоритм для продвижения сайтов?

Все последние алгоритмы, не только «Королёв», но и «Палех», «Баден-Баден», призывают только к одному — делать сайты не для машин, а для людей. Просто SEO-текстов и технической оптимизации недостаточно: в топе оказываются сайты не по количеству ключей на его странице, а по реальной полезности для людей. Теперь поисковые системы больше любят не SEO-тексты, а LSI-копирайтинг. Да, не все вебмастера вкладываются в реально полезный для пользователя контент, в удобство юзабилити и пр., кто-то предпочитает накручивать поведенческие факторы, покупать ссылки и публиковать на сайтах низкосортные SEO-тексты. Запуск «космического» алгоритма — еще один шаг на пути очищения интернета от низкокачественных и неполезных ресурсов: теперь в приоритете смысл.

Выводы

  1. Ранее поисковые системы ранжировали страницы по наличию в них ключевых слов: больше слов, релевантнее страница. Сегодня все изменилось — искусственный интеллект понимает, какие сайты полезны пользователем, а какие нет.
  2. Машинное обучение в Яндексе применяют еще со времен запуска алгоритма «Палех». Отличия «Палеха» от «Королёва» заключаются в следующем: нейросеть в алгоритме «Палеха» подключается на последнем этапе ранжирования и обрабатывает всего 150 страниц, прошедших предварительный отбор; «Королёв» подключает нейросеть гораздо раньше, поэтому количество обрабатываемого материала доходит до 200 000 страниц. «Палех» сравнивает смысл заголовка страницы и ключевой запрос пользователя. «Королёв» сравнивает не только заголовок и поисковый запрос, но и всю страницу целиком. Благодаря этому «Королёв» может лучше отвечать на сложные и низкочастотные запросы.
  3. В Яндексе призывают создавать полезные сайты для людей: алгоритм «Королёв» будет повышать позиции тех страниц, которые реально будут отвечать на пользовательские запросы. Поэтому придется создавать отдельные страницы, решающие каждый интент (задача, которую подразумевает пользователь).
  4. С приходом «Королёва» SEO-оптимизаторы будут больше времени уделять технической оптимизации сайта, поскольку структура сайтов усложнится. Необходимо создавать больше качественного контента — это дороже и требует больше времени.
  5. Затраты на SEO-продвижение увеличатся, поскольку нужно будет серьезно дорабатывать сайты с точки зрения качества и полезности для посетителя. Их позиции будут расти в выдаче, а низкосортные ресурсы будут теряться в результатах поиска.

В Яндексе обещают, что качество поиска с приходом «Королёва» повысится. Увидим на практике.

Пресмотреть презентацию от Яндекса здесь.

Веб студия «Оренсайт»

Все права защищены © 2005–2016

460000 г. Оренбург ул. Дружбы 16

Тел.: (3532) 23-30-23

Время работы с 9.00-18.00

РАБОТАТЬ С НАМИ –
ОДНО УДОВОЛЬСТВИЕ

Хотите узнать, как получить 30% скидку на наши услуги?
Мы позвоним вам и все расскажем!
Я согласен на обработку персональных данных