Поисковые системы. Основные принципы работы

Одна из фундаментальных задач Интернета сегодня – предоставление объективной информации. Неоценимую помощь в этом непростом деле оказывают поисковые системы (далее – ПС). Главная задача любой ПС в принципе одна и та же – дать максимально точный и информативный ответ на конкретный вопрос, который был задан в поисковой строке пользователем. Чем точнее работает поисковик, тем больше людей к нему постоянно обращаются, тем выше доходы от размещенной рекламы.

Для нас, продавцов и покупателей, поисковики имеют громадное значение. Если мы что-то продаем, то именно ПС приводят к нам на сайт самого благодарного покупателя. Ведь этот человек уже ищет в интернете конкретный товар и готов отдать за желанную покупку свои кровные сбережения. Осталось только свести вместе ищущего конкретный товар покупателя и услужливого продавца этого товара. Именно поисковые системы приводят на наши продающие сайты самого выгодного, с точки зрения покупательной способности, клиента.

Основная цель любой ПС — решить для себя, какие сайты заслуживают доверия и годятся для показа пользователям, а какие надо занести в черный список и никогда никому не демонстрировать. Для этого нужна всего-то малость — проанализировать содержание сотни миллионов сайтов во всем Интернете и систематизировать миллиарды терабайтов полученной информации. Попробуем разобраться, как выполняют эту кропотливую работу поисковые системы (ПС).

1. Поиск.

Чтобы любая ПС могла полноценно функционировать, она должна иметь собственную базу данных, куда входят копии всех сайтов, известных поисковику. Эту основополагающую информацию постоянно собирает специальная программа – поисковый робот. Задача робота – передвигаясь в Интернете по ссылкам от одного сайта к другому, находить новую информацию (контент) и передавать её в базу данных своей родной ПС. Обратите внимание – поисковый робот передвигается от сайта к сайту по ссылкам. Ссылки – это как тропинки в темном густом лесу, по ссылкам ходят люди и поисковые роботы.

Итак, первая задача любой ПС – постоянно искать и находить на бескрайних просторах Интернета новую информацию. Конкретнее – сканировать и создавать в своей базе данных копии всех найденных страниц. Характерно, что алгоритм действия индивидуален у каждой ПС, поэтому и результаты поиска могут быть весьма различными. У разных людей (создателей алгоритма работы ПС) расходятся взгляды на «что такое хорошо и что такое плохо». Поэтому разные ПС выдают разные результаты.

2. Индексация.

Получив свежую информацию от поискового робота о новом сайте (новом контенте), другая служебная программа (тоже робот) немедленно сканирует содержимое нового сайта, методично обходит его странички по внутренним ссылкам (если они есть) и сохраняет в своей базе данных копии найденного текста, фотографии, видеоролики, ссылки и прочие полезности и вкусности.

Новый сайт «прописывается» в базе данных поисковой системой (этот процесс называется индексация). Процесс поиска и индексирования занимает некоторое время – несколько дней или недель. Кстати, название Яндекс придумано от термина Индекс. Теперь новоиспеченный сайт становится полноправным участником жесточайшего соревнования под названием «ранжирование» (от слова «ранг»).

3. Ранжирование.

Если на первые два этапа – поиск и индексация – владелец сайта повлиять не может (или почти не может, только через функцию «Добавить сайт»), то для корректировки результатов ранжирования существует целая наука под названием SEO оптимизация и профессия «сео оптимизаторы» (сеошники). Вопрос ранжирования сайтов в выдаче поисковика является для нас архиважным, поэтому остановимся на нем подробнее.

Задав в поисковой системе какой-то вопрос, мы практически немедленно получаем ответы. В качестве ответов служат ссылки из базы данных ПС, ведущие на проиндексированные сайты. Именно там (по мнению ПС) находится уникальная и потому очень ценная для нас информация. Этих ответов (ссылок) может быть много или очень много. Например, по запросу «как работает поисковая система», русскоязычный Яндекс реально выдает более 266 млн. ответов. Но ведь каким-то образом ПС выстраивает эти ответы в определенном порядке (ранжирует)! Ведь кто-то попал на первое место, кто-то на десятое, а кто-то на миллионное! Ну почему?!

Для начала поисковая система определяет релевантность сайта. Релевантность – это степень совпадения содержимого сайта с запросом пользователя. Если пользователь спрашивает у ПС курс доллара на ММВБ, то выдаваться должна именно эта актуальная информация, а не стоимость молодой картошки на Центральном рынке. Сначала отбираются сайты, наиболее релевантные запросу. Но и таких страничек оказывается в Интернете, как правило, тьма тьмущая. Даже релевантные сайты надо как-то систематизировать, расставить по порядку. Из всех релевантных сайтов ПС всегда старается выбрать наиболее подходящие и поставить их в начало выдачи.

Ранжирование – это и есть процесс упорядочивания выдачи релевантных сайтов. Создание очередности среди всех сайтов, которые выдал поиск. Ранжирование – это очень важно! Почему? Представьте, что мы ищем какой-то товар, что весьма характерно для Ярмарки Мастеров. Задав в поиске Ярмарки Мастеров название этого товара, мы получим некоторое количество ответов – страничек. Зачастую количество этих ответов превышает цифру 10 000. Скажите, будет ли нормальный среднестатистический покупатель просматривать 10 000 страничек? Наверное, нет. Покупатель обязательно посмотрит первую страничку, наверное, вторую и третью, может быть четвертую и пятую. Особо терпеливые и настырные искатели доберутся до десятой страницы выдачи. А вот на десятитысячную работу посмотрят очень мало покупателей, если таковые вообще найдутся.

Мораль сей басни такова – будь первым в ранжировании и покупатели к тебе потянутся. По статистике в Топ 3 (первая тройка) заходят все покупатели, в Топ 10 около 80 %, к сотым – практически никто. Ранжироваться в первых рядах выгодно экономически! Как пела незабвенная группа ABBA «The Winner Take It All» - «Победитель получает всё!». Тут многие мне возразят – много зашедших на огонек ранжирования посетителей — это еще не много покупателей. Другой бы спорил, а я не буду, потому что согласен. Соотношение зашедших посетителей и реальных покупателей называется конверсия. Но об этом поговорим позже. Наверное. Если захотим.

Закономерно, что у владельцев продающих сайтов возникает жгучее желание ознакомиться подробнее с реальным алгоритмом действия поисковых систем и как-то с ним подружиться. Как говорили раньше преферансисты: «Знал бы прикуп – жил бы в Сочи». К сожалению, узнать в полном объеме алгоритм ранжирования невозможно.

- это конфиденциальная информация;

- алгоритм ранжирования постоянно меняется и совершенствуется;

- количество переменных составляющих в алгоритме ранжирования, например Яндекса, составляет более 700 параметров .

Чтобы хоть как-то утолить наше любопытство и понимать, в каком направлении надо двигаться, в открытом доступе в Сети существует информация, в самых общих чертах проливающая свет. Самые общие рекомендации от Яндекса по улучшению ранжирования сайта выглядят так:

- привлекательный дизайн, помогающий пользователю быстро разобраться в содержимом сайта;

- удобство пользования сайтом, интуитивно понятный интерфейс, отсутствие рекламы;

- полезный и уникальный контент (тексты, фото, видео).

Согласитесь, весьма расплывчатые рекомендации. Периодически в свободной печати появляются статьи с названиями типа «200 факторов ранжирования», им можно и нужно верить, читать и применять на практике. Но формат этой публикации не позволяет рассматривать их содержимое. К тому же, надо быть очень здорово в теме, что бы понимать, о чем вообще говорят эти умные дяденьки.

А теперь вернемся на бренную землю, на нашу Ярмарку Мастеров. У меня есть стойкое убеждение, что алгоритм ранжирования на Ярмарке Мастеров в основном схож с алгоритмом действия других ПС. В первую очередь уникальный текст, правильно подобранные названия работ, грамотно прописанные ключевые слова, обстоятельное описание своих работ. Что еще надо, чтобы зазвать покупателя из поиска Ярмарки Мастеров? Может быть, кто-нибудь из читателей статьи поделится своими наработками или практическим опытом?

С уважением и благодарностью ко всем читателям, сумевшим добраться до конца публикации, Владимир.