Утечка алгоритмов выдачи Google подтвердилась

Логотип компании
30.05.2024
Утечка алгоритмов выдачи Google подтвердилась

Изображение: TY Lim / Shutterstock.com

Просочившаяся в интернет внутренняя документация Google позволяет заглянуть внутрь поисковой системы и раскрывает наиболее важные алгоритмы ранжирования контента. Тысячи документов, которые, судя по всему, утекли из внутреннего хранилища API контента Google, были опубликованы на Github автоматическим ботом под названием yoshi-code-bot.

Пожалуйста учитывайте, что эта информация верна по состоянию на март месяц 2024 года. Также в документации не указано, как оцениваются какие-либо характеристики ранжирования — они просто существуют. Предполагается, что эти характеристики используются для корректировки оценки важности информации в документе или для изменения рейтинга документа.

Рейтинг выдачи может быть понижен из-за того, что:

  • Материал не соответствует целевому назначению сайта;

  • Отслеживание результатов поисковой выдачи указывает на недовольство пользователя;

Предположительно, Google хранит копию каждой версии каждой страницы, которую он когда-либо индексировал. Это означает, что Google может «запомнить» каждое изменение, когда-либо внесенное на страницу. Однако при анализе ссылок Google использует только последние 20 изменений URL-адреса.

Согласно внутренним документам Google:

  • Актуальность имеет значение: Google смотрит на даты в подписи (bylineDate), URL-адресе (syntacticDate) и содержании страницы (semanticDate).

  • Чтобы определить, является ли документ основной темой веб-сайта, Google векторизует страницы и сайты, а затем сравнивает встраивания страниц (siteRadius) с встраиваниями сайта (siteFocusScore).

  • Google хранит информацию о регистрации домена (RegistrationInfo).

  • Названия страниц по-прежнему имеют значение. У Google есть функция titlematchScore, которая, как полагают, измеряет, насколько хорошо заголовок страницы соответствует запросу.

  • Google измеряет средневзвешенный размер шрифта терминов в документах (avgTermWeight) и якорном тексте.

В принципе, даже с учетом просочившихся сведений о механизмах ранжирования, все рекомендации сводятся к одной: для того чтобы иметь высокий рейтинг в поисковике, необходимо получать больше просмотров и перенаправлений с других сайтов, используя качественный и оригинальный контент. Работа над привлечением именно вашей целевой аудитории, пошлет в Google сигнал о том, что ваша страница заслуживает высокого приоритета.

(обновлено 31 мая):

Google подтвердила подлинность 2500 просочившихся внутренних документов, подробно описывающих ее методы сбора данных. Документы дают представление о тщательно охраняемом алгоритме поискового ранжирования Google.

Утечка материалов показывает, что Google все же собирает и использует данные, которые, по словам представителей компании, не способствуют ранжированию веб-страниц в поиске Google, такие как клики, данные пользователей Chrome и многое другое.

Однако, представитель Google Дэвис Томпсон (Davis Thompson) заявил: «Мы предостерегаем от неверных предположений о Поиске, основанных на вырванной из контекста, устаревшей или неполной информации».

Тысячи страниц документов служат хранилищем информации для сотрудников Google, но неясно, какие именно фрагменты данных на самом деле используются для ранжирования поискового контента — информация может быть устаревшей, использоваться исключительно в учебных целях или собираться, но не использоваться для механизмов оптимизации поиска. 

Читайте также
Для удобства восприятия и передачи информации можно пользоваться схемами и диаграммами, благодаря чему удается красиво и лаконично отразить связность объектов и их свойства. Для создания подобных визуализаций существуют специальные программные приложения, о которых рассказывает IT-World.

Источник: searchengineland.com