В конце мая стало известно, что в сеть попали документы с данными о работе алгоритмов поиска Google. Какие важные сведения в них содержатся и что с этим делать SEO-специалистам и владельцам сайтов, рассказываем в нашем материале.

Какие данные попали в открытый доступ

Анонимный пользователь (некто Erfan Azimi, владелец SEO-фирмы) слил в сеть 2500 внутренних документов, описывающих работу Google Поиска по состоянию на март 2024 года. Документы из внутреннего хранилища API контента Google были опубликованы 27 марта на Github автоматическим ботом.

Пример документаПример документа, источник

Это самая масштабная утечка, связанная с алгоритмами ранжирования в поиске Google, за последние 10-15 лет. В документации содержится 2596 модулей с 14 014 атрибутами. Модули связаны с компонентами YouTube, Assistant, Books, поиском видео, ссылками, веб-документами, инфраструктурой сканирования, системой внутреннего календаря и People API. 

30 мая представитель компании Дэвис Томпсон подтвердил подлинность документов, однако предостерег от ошибочных выводов на основе «вырванной из контекста, устаревшей или неполной информации».

В сети слитые данные часто называют «алгоритмом Google», но это не так. Хотя в документах содержатся важные сведения о данных, которые Google использует, чтобы улучшать поисковую выдачу.

Что влияет на ранжирование в Google: факторы из слитых документов

Из утечки стало ясно, что Google часто лукавит, описывая факторы, которые должны повлиять на успешное ранжирование сайта в поиске, в частности, полезный контент. Знаменитое выражение «content is king» теперь под вопросом. Также поисковик поймали на отрицании сигналов, которые, по словам его представителей, на ранжирование никак не влияют, однако в документации они есть.

Важно: в документах не указано, какой вес имеют те или иные факторы ранжирования — они просто перечислены.

На основе содержимого документов мы выделили несколько групп факторов, которые действительно влияют на ранжирование сайтов в поиске Google.

Возраст сайта, домен и сила бренда

  • Возраст сайта, или авторитет домена. Несмотря на неоднократные заявления представителей поисковика об отсутствии так называемой «песочницы» для новых ресурсов, похоже она всё-таки есть. Google отдает приоритет сайтам с историей.
  • Доменное имя и названия субдоменов. Ранее в Google утверждали, что не имеет значения, используете вы в структуре сайта поддомены или подпапки — эти варианты эквивалентны. На это стоит обратить внимание сайтам с региональными поддоменами.
  • Сила бренда. Поисковик оценивает популярность бренда по числу его упоминаний в сети, и эти упоминания не обязательно должны сопровождаться ссылками на сайт. Как следствие, для большинства небольших бизнесов и сайтов пробиться в топ почти нереально, придется прокачивать бренд и работать над репутацией, формируя пул лояльной аудитории.

Поведенческие факторы

Вес поведенческих факторов в Рунете традиционно приписывают Яндексу, но утечка подтвердила, что пользовательское поведение на странице влияет на её ранжирование. Упомянем однако, что в публичных заявлениях и интервью представители Google подчеркивали важность релевантности, качества и пользовательского опыта. Но при этом отрицали использование конкретных показателей в качестве факторов ранжирования — таких, как рейтинг кликов или показатель отказов.

О том, что такое поведенческие факторы и как их улучшить, читайте в блоге PromoPult.

Еще одним не слишком приятным для многих открытием стало то, что данные о кликах, переходах и поведении посетителей берутся не только из Google Analytics, но и напрямую из браузера Chrome. На это в слитых данных указывает модуль ChromeInTotal. Использование данных браузера в алгоритмах ранжирования неоднократно отрицали представители Google.

Как это происходит простыми словами: Chrome передает кликстрим — все страницы, на которые вы заходите, используя этот браузер, будут переданы в Google, а данные будут учтены в ранжировании. 

Передачу данных обеспечивает система NavBoost. Она оценивает количество поисковых запросов по заданному ключевому слову, чтобы определить тенденцию поискового спроса, количество кликов по результату поиска, CTR и условно делит клики на «плохие» (badClicks), «хорошие» (GoodClicks), «долгие» (LastLongestClicks) и т. д.

Еще из интересных открытий — Google может использовать при ранжировании сайтов данные из EWOK, который можно условно назвать аналогом Толоки от Яндекса. Это система оценки поисковой выдачи «живыми» людьми. То есть в ранжировании задействованы не только автоматические алгоритмы, но и пользователи, которые определяют, какой из нескольких сайтов лучше по тому или иному запросу.

Ссылочные факторы

Положительно влияет на ранжирование сайта разнообразный и релевантный ссылочный профиль. Google оценивает анкорный текст, количество трафика на странице, куда ведет ссылка, наличие или отсутствие ссылочного спама. 

PageRank, давний компонент алгоритма Google, остается важным фактором, особенно для главной страницы сайта. Более того, новые документы временно получают значение PageRank домашней страницы, пока не получат собственный показатель. Ну и подтверждение очевидного — ссылки с более популярных сайтов вносят больший вклад в PageRank.

У Google есть три уровня для классификации ссылок: низкое, среднее и высокое качество. К какому из уровней отнести ссылку, определяется количеством кликов по ней. Проще говоря, если по ссылке переходят, она передает сигналы ранжирования, если нет — помечается как низкокачественная. Некачественные ссылки не повредят рейтингу сайта, Google их просто игнорирует.

Сформировать эффективный ссылочный профиль для продвижения сайта поможет обновленная технология PromoPult Max. Умный алгоритм подбирает максимально релевантных доноров для конкретной страницы и поискового запроса. Результат — рост позиций и органического трафика уже в первые недели продвижения. Вот кейсы использования технологии:

Протестировать технологию можно бесплатно в течение двух недель. Просто оставьте заявку, предоплата не требуется. Решение, продолжать ли продвижение дальше, примете по результатам теста.

Подробное описание работы PromoPult Max — здесь.

Свежесть, актуальность и безопасность контента

  • Содержимое тега title по-прежнему имеет значение. У Google есть функция titlematchScore, которая измеряет, насколько хорошо заголовок страницы соответствует запросу.
  • EEAT факторы также влияют на ранжирование. Однако непонятно, какое конкретно влияние оказывает каждый элемент. Точно известно лишь то, что Google хранит информацию об авторах контента и оценивает их авторитетность.
  • Документы из группы YMYL (Your Money Your Life) — медицины, финансов, новостей — ранжируются на основе оригинальности контента. В документации указано, что у Google есть классификаторы, которые генерируют отдельные оценки для YMYL Health и YMYL News.
  • Свежесть и актуальность информации. Google оценивает даты в подписях, URL-адресах и контенте на странице.

Какая еще важная информация содержится в документах

В Google существует набор функционала под названием «Twiddlers» — это опции переранжирования, которые меняют рейтинг документа в поисковой выдаче. Причины пессимизации могут быть следующими:

  • Несовпадение ссылки и контента страницы, на которую она ведет.
  • Сигналы поисковой выдачи указывают на недовольство пользователей.
  • Низкое качество обзора продукта.
  • Релевантность местоположения — на первые места Google старается вывести сайты, соответствующие геолокации пользователя.
  • Название домена точно соответствует поисковому запросу (например, top-sneakers-ever.com).
  • Неприемлемый контент (например, порнография).

Google может использовать различные факторы ранжирования или алгоритмы для конкретных отраслей поиска — таких, как новости, локальный поиск, путешествия или ecommerce. Например, для локальных сайтов важно упоминание в региональных агрегаторах и обзорах, картографических сервисах, каталогах. Для путешествий важна информация о бронировании и ценах. А новости требуют своевременного, правдивого и актуального контента.

В поиске Google есть белые списки сайтов по определенным «чувствительным» тематикам, например, таким, как COVID и выборы в США. Есть подозрение, что такие списки составлены на основе данных официальных источников.

Из документов следует, что Google хранит копию каждой версии каждой страницы, которую он когда-либо индексировал. Это означает, что поисковик может «запомнить» каждое изменение, когда-либо внесенное на страницу. Однако при анализе ссылок Google использует только последние 20 изменений URL-адреса.

Чтобы бороться со спамом, связанным с ручными и автоматическими кликами, Google использует историю файлов cookie, данные входа в систему Chrome и обнаружение шаблонов в поведении пользователя.

Полный список сигналов найдете по ссылке. Подробный анализ слитой документации — в материалах Рэнда Фишкина и Майка Кинга. Все источники на английском языке.

Как всё же попасть в топ Google: советы вебмастерам и владельцам сайтов

  • Оптимизируйте сайт для удобства пользователей — создайте понятную структуру, продумайте навигацию, внедрите перелинковку. Добавьте на страницу конверсионные элементы и блоки, удерживающие внимание и продлевающие время просмотра, — видео, фото, калькуляторы, конструкторы и прочее. Всё это положительно повлияет на поведенческие факторы ранжирования.
  • Вкладывайтесь в развитие бренда. Чтобы заслужить доверие Google, поддерживайте активность в соцсетях, ведите блоги на тематических площадках, формируйте лояльную аудиторию, в том числе, и в офлайне, которая будет искать вас в поиске по названию сайта или компании, работайте над репутацией в сети. Инвестируйте в традиционный PR и рекламу в СМИ. К сожалению, данные говорят о том, что в конкурентных нишах обогнать в топе крупные бренды не получится.
  • Сосредоточьтесь на создании разнообразного, качественного и релевантного ссылочного профиля. В этом поможет технология PromoPult Max.
  • Заголовки страниц (title) по-прежнему очень важны. Проверьте, отвечают ли они на ключевой запрос пользователя и соответствуют ли содержанию документов. Привлекательные заголовки увеличивают CTR в поисковой выдаче и дают Google положительные сигналы.
  • Используйте авторитетных авторов контента, особенно для YMYL. Правильно размечайте данные на страницах авторов, чтобы передать их в Google. Всё о разметке JSON-LD рассказали в этой статье.
  • Регулярно обновляйте контент, поддерживайте его актуальность.
  • Используйте специфические сигналы ранжирования для своей отрасли. Например, региональным сайтам стоит работать над продвижением в локальном поиске, сайтам новостей — регулярно постить свежий контент, агрегаторам для путешественников — размещать обзоры на туры, информацию о ценах и бронировании.

В конце дадим совет обычным пользователям. Если не хотите, чтобы ваши данные о поведении на сайтах отправлялись в Google, откажитесь от использования браузера Chrome. Например, пользуйтесь Opera или Firefox.

Реклама. ООО «Клик.ру», ИНН:7743771327, ERID: 2VtzqwnTRxz

Чтобы продолжить чтение, зарегистрируйтесь в PromoPult и применяйте знания на практике

Подключите бесплатное продвижение на 2 недели в PromoPult

Для селлеров и владельцев сайтов:

реклама в Яндексе, VK, на Wildberries и SEO в едином интерфейсе

Бесплатные инструменты

для управления рекламой и аналитики конкурентов на WB

Биддер автокампаний WB
Вы выбираете инструменты wildberries
Удерживает диапазон позиций по min
ставке или max позицию по заданной CPM

Настоящим Я даю свое полное согласие на получение электронных уведомлений (на указанные мой абонентский номер и адрес электронной почты), а также выражаю явное и полное согласие на сбор, хранение, обработку и передачу персональных данных, согласно положениям, изложенным в Политике конфиденциальности, расположенных по адресу: promopult.ru/rules.html?op=private, с которыми я ознакомился и принял.