Андрей Калинин, руководитель проекта Поиск Mail.ru, был очень рад знаменательному событию этого года — полному переходу Поиска Mail.ru на собственный движок. В связи с этим важным событием он решил рассказать о «кухне» поисковой системы на конференции CyberMarketing-2013.
Безусловно, в России уже есть и давно действуют поисковые системы, работающие на своих движках, но их очень мало, поэтому еще один не помешает никому. А возможно, даже станет выгоднее, чем остальные, так как имеет отличающуюся политику и неплохой охват пользователей — 25-27 млн человек.
Что волнует оптимизаторов и вебмастеров?
- Индексирование всего сайта
- Появление сайта в выдаче по определенным запросам
- Трафик
Как добиться отличного индексирования?
Первое правило — сделать свой сайт максимально доступным для поисковика. Бывает такое, что вебмастера и оптимизаторы даже не в курсе, что их сайт (или некоторые его страницы) заблокированы поисковиками. Это может произойти совершенно случайно, например, по недосмотру сисадмина, которому вдруг не понравилось появление поискового робота в логах.
После устранения подобной проблемы у поисковика возникает другой важный вопрос: «Сколько страниц сайта скачивать?» Конечно же, вебмастер попросит скачать все, опять же иногда и не догадываясь, сколько тысяч неизвестных страниц у его сайта.
Все дело в том, что сайт, созданный автоматически, позволяет генерировать неограниченное количество url. Это технический мусор. К нему относятся многие «незаметные» особенности:
- Списки товаров. Когда сайт построен так, что при каждой сортировке (по дате, по виду продукции, по размерному ряду или по сезонности) открывается новый адрес, то количество расплодившихся адресов в итоге стремится к бесконечности.
- Разделение по регионам. Отдельный сайт (со всеми вкладками) для каждого региона присутствия компании множит количество адресов.
- Облака тегов. Здесь тоже все хорошо в меру.
- Афиша. Опытным путем выяснилось, что некоторые афиши можно пролистать назад аж до 1812 года и понять, что в тот день фильмов на экране не было.