Материал из Wiki.
Учитывая большое количество постингов на всех мыслимых форумах, напрашивается вывод, что многие просто не знают, где
найти информацию относительно недавнего апдейта Google. Здесь будет сделана попытка внятно (я надеюсь) изложить максимум доступной
информации, а также привести (неподтвержденные) теории, объясняющие алгоритм этого апдейта.
Вступление
Начиная с 16 ноября, в системе Google наблюдался серьезный сдвиг в результатах запросов. Ветераны признают, что Google, судя по
всему, сделал грандиозный апдейт, невиданный в течение многих месяцев. Первыми об этом заговорили на WebMasterWorld, где апдейт назвали "Florida", приравняв его, таким образом, к урагану. Да уж, это
действительно был ураган! Как и после других апдейтов, послышались стоны и ворчание жалующихся на то, что их сайты упали в рейтинге.
Многих это явление не задело (включая нас), но вот симптомы падения рейтинга сайтов были необычны. Похоже, к "упавшим" страницам не
применялись штрафы, подобные PR0, однако ни одна из этих страниц, ориентированных на специфичные ключевые фразы, и в особенности
индексные/домашние страницы, не появились вверху результатов по соответствующим запросам. В действительности, некоторые страницы
опустились на сотни позиций, а в некоторых случаях вообще выпали из результатов запроса — несмотря на то, что эти же страницы
появлялись в результатах по несущественным запросам, и очевидно присутствовали в индексе Google.
Нам, а также некоторым другим признанным авторитетам, показалось (и вызвало возражения у других гуру), что было применено
некое подобие фильтра на уровень оптимизации для поисковых систем (SEO), чтобы проверить, не проводилась ли чрезмерная SEO для
данной фразы. Если плотность оптимизации, как на странице, так и вне ее, выглядела слишком искуственной, применялся фильтр, и страница
съезжала вниз — исключительно для этой фразы.
Google никогда не поощрял злоупотребление своей системой, и многие почтенные SEO-гуру расценили это изменение алгоритма
как попытку Google избавиться от недоброкачественного использования ссылок, а также остановить получение (а иногда и покупку) ссылок,
содержащих ваш ключевой текст у сайтов с высоким PR, но совершенно иррелевантных по тематике для вашего сайта. В этом, пожалуй, есть
смысл.
В пятницу, 21 ноября, Google решил применить "фильтр". Адские ворота раскрылись, и десятки тысяч сайтов исчесли с позиций,
которые они занимали в течение (в некоторых случаях) нескольких лет. Мы стали свидетелями, как сайты некоторых наших клиентов спустились
с №1 для своей ключевой фразы в совершенное небытие. Причем это наблюдалось только в высоко конкурентных областях, но не по их
второстепенным фразам. Эти сайты, в большинстве случаев, не были сильно оптимизированы, не искали взаимных ссылок, но получили свои
позиции, находясь в Интернете в течение 4 или 5 лет. Плохая новость заключалась в том, что название их компаний и домены включали
ключевые фразы, сайты (включая директории), ссылающиеся на эти сайты, содержали ключевые фразы в своих ссылках. Google
интерпретировал это как сверх-оптимизацию - и только их и видели. Во многих областях исчезли все первые 20 сайтов, включая лидеров
отрасли, а заменили их образовательные сайты, новостные сайты, государственные сайты, а также крупные торговые порталы или директории.
Случилось что-то серьезное, но что?
Факты!
Тысячи веб-страниц внезапно понизились в результатах запросов Google, в основном по главным коммерческим поисковым
терминам, на которые они ориентировали свои страницы, а на смену им пришли другие сайты, которые, в основном, весьма туманно связаны с
этими поисковыми словами. Некоторые из последних оказались крупными торговыми порталами или бизнес-директориями, включающими в
своих листингах соответствующие тематике запроса компании, однако многие не содержат даже этого.
"Релевантные" сайты, занимающие высокие позиции в рейтингах, похоже, не попали под действие фильтра.
Изменения очень явно проявились в региональных англоязычных отделениях Google, где применялся региональный фильтр, а
количество "релевантных" сайтов намного меньше.
Для примера возьмем запрос в Google UK по слову "shelving" (оборудование полками). Ранее в результатах этого запроса по Search UK появлялись, в основном,
британские поставщики оборудования для полок. Сейчас запрос возвращает:
№1 — об организации книгохранилища в университете Шеффилда — образовательный сайт .ac.uk
№2 — торговая директория — Dealtime — популярный коммерческий торговый сайт
№3 — торговая директория — Dealtime — популярный коммерческий торговый сайт
№4 — Университет Лидза о необходимости создания полок для книг университета — образовательный сайт
.ac.uk
№5 — колледж Букингемпшира, со статьей о некоторых проблемах хранения книг — образовательный сайт
.ac.uk
№6 — Kelly Search a UK Business Directory (наподобие Yahoo или Желтых Страниц) — государственный
сайт-директория
№7 — этапы организации книгохранилища в Университете Шеффилда — образовательный сайт .ac.uk
№8 — статья с новостного сайта, описывающая организацию архива индийской службы паромов — новостной
сайт
№9 — то же, что и в п.8 — новостной сайт
№10 — информация о сотрудниках библиотеки Университета в Лоуборо, занимающихся организацией хранения книг —
образовательный сайт .ac.uk
В результатах этого же поиска
на основном сайте Google появляется один сайт, продающий полки для книг, 6 торговых порталов, 2 университета и 1 магазин Amazon. Ранее
эти же результаты содержали 9 поставщиков книжных полок.
Остальные результаты запросов остались без изменений. Возьмем, к примеру, слово "jackets". На подобный запрос может быть
найдено множество разнообразных сайтов, но сейчас он возвращает результаты , которые
мы привыкли получать в Google. Новый алгоритм, похоже, не был применен для этого запроса.
Участники WebMasterWorld выступили с интересным наблюдением, которое мы подтверждаем. Только определенные фразы были
выбраны для обработки с помощью нового алгоритма. И действительно, стоит только исключить из запроса несущественную строку (например
-waffle), как сразу все становится на свои места. Если вы запрашиваете shelving
-waffle"</a> в UK, все сайты, которые ранее занимали в рейтинге первые строки, появляются снова. Аналогично, в результатах этого запроса в основном Google исчезают все
торговые порталы, а поставщики книжных полок появляются! Такой же трюк со словом jackets не дает заметного
различия между результатами этих двух запросов. Почему?
Мы протестировали более 500 ключевых фраз, и пришли к выводу, что некоторые фразы попали под новый алгоритм, а некоторые
нет. Те, которые подверглись обработке, всегда оказывались коммерческими, хотя среди остальных тоже часто встречались коммерческие фразы.
Так почему же именно эти, а не другие попали под воздействие фильтра? Совершенно некоммерческие фразы ни разу не дали повода
предполагать, что к ним использовался новый алгоритм/фильтр.
Если вы попробуете сами, и выберете фразу длиннее 2 слов, то вам придется добавлять к запросу дополнительный мусор. Так, web
design Toronto должен быть web design Toronto -waffle -woggle.
Таковы факты. Однако, непохоже, чтобы Google допустил подобную брешь в виде разных результатов запроса. Если это ошибка, она будет
устранена через несколько дней. Если все останется без изменений, значит так и было задумано.
Гипотезы
Недостатка в гипотезах о том, что произошло, нет, и обсуждения ведутся очень жаркие. У нас есть своя собственная теория,
основанная на вполне основательных исследованиях, и мы включили ее в этот отчет именно как нашу гипотезу. Другие версии тоже будут
рассмотрены, с нашими комментариями. Но имейте в виду, что все это лишь гипотезы, причем некоторые из них довольно причудливые, в то
время как другие могут быть недалеки от истины - но только Google знает, что он делает. Причем он всегда доступен, чтобы проверить ваши
собственные умозаключения.
Самая логичная, на мой взгляд, теория, разделяемая в разной степени большинством специалистов в этой
области, следующая:
Google наблюдал, в течение последних нескольких лет, как специалисты SEO манипулировали результатами запросов в этой
поисковой системе. Использование PageRankTM для оценки "веса" страниц привело к масштабной торговле ссылками, с основной целью
повлиять на рейтинги в Google, но не для естественного обмена ссылками. В некоторых случаях, владельцы сайтов не ссылались на сайты без
предварительной оценки того, как скажется эта ссылка на их позициях в Google. Опимизация в Google свелась, в основном, к тому, чтобы
ключевая фраза вашей страницы располагалась во всех подходящих местах на этой странице, и чтобы все входящие ссылки содержали эту фразу
в своих текстах. Тысячи оптимизаторов и вебмастеров выполняли эти простые основные правила, и наслаждались тем, что Google вознаграждал
их за это высокими рейтингами. При этом все забыли, что изначально Google хотел предоставить сурферам наиболее "релевантные" результаты.
Чтобы, если кто-то искал дешевые компьютеры, он находил сайт, который "заслужил" репутацию сайта, предоставляющего дешевые
компьютеры, но не сайт, вебмастер которого оптимизировал свое детище путем получения ссылок с фразой "дешевые компьютеры",
расположенных на множестве далеких от компьютеров сайтов. Данный апдейт стал попыткой возобновить баланс и возвратиться к методу
расчета результатов, правильному с точки зрения Google. Наиболее очевидным способом решения данной проблемы было бы выделение
основных терминов, с которыми могли проводиться манипуляции. Это, несомненно, коммерческие фразы, а выделить их можно несколькими
способами.
В системе Google собрана обширная информация, поставляемая популярным тулбаром Google, которая может дать наметки того, что
ищут люди, когда собираются сделать покупку.
Существует словарь коммерческих терминов Google AdWords, созданный самими вебмастерами, вместе с количеством денег,
которые они готовы заплатить за клик. В общих чертах можно составить впечатление о том, какие фразы наиболее востребованы, и насколько
они интересны для вебмастеров.
Формы искусственного разума и семантического анализа в программах, используемых Google. Для получения общего
представления об этом вопросе стоит почитать Applied Semantics White Paper , которое используется AdSense, а также алгоритм Hilltop - оба продукта могут
использоваться Google.
Какой бы метод ни использовался (это может быть любой, или вовсе никакой из них), но в результате Google определяет
востребованные поисковые фразы. Затем, когда происходит поиск по этим фразам, система накладывает оптимизационный фильтр, чтобы
устранить воздействие оптимизированных сайтов на результаты поиска, и выдает исправленные, "релевантные" результаты. Вот почему
прослеживается тенденция к показу государственных, образовательных сайтов, торговых порталов, бизнес-директорий и новостных сайтов в
результатах многих запросов. Однако, определенные коммерческие сайты могут расцениваться как соответствующие запросу. Они остаются в
результатах запроса, хотя многие из них потеряют свои предыдущие позиции. Это и есть та теория, которой мы придерживаемся. На наш взгляд,
именно это намеревался сделать Google в результате своего апдейта.
Изменения и дополнения к этой теории следующие:
Google пытается заставить вебмастеров, которые были замечены в манипулировании результатами запросов Google, использовать
AdWords, и поэтому их сайты были удалены из результатов запросов. Я считаю, что это может быть положительным побочным эффектом
изменений (для Google), но не их первопричиной.
Google пытается разделить свои результаты на некоммерческие и коммерческие. Коммерческие результаты будут содержаться в
AdWords, а некоммерческие - в обычном листинге, изначально использовавшемся для поиска информации. Мое мнение - вполне возможно, что
это я пустил такой слух, высказавшись в довольно ироничной форме по этой теме на форуме High Rankings. Но в реальности осуществить подобное практически
невозможно, да и сама идея Google возвращать на любые запросы наиболее релевантные сайты может оказаться под угрозой. И хотя сейчас
некоторые результаты запросов выглядят именно так, я считаю, что данная гипотеза неверна.
Google изменил свои алгоритмы так, чтобы они подходили его крупным рекламодателям. Я считаю, что это весьма маловероятно, и
вряд ли Google захочет предстать перед всеми в качестве нечистой на руку компании. Растущая непопулярность Google в среде "кинутых"
вебмастеров не в счет.
Не существует отдельного алгоритма для "коммерческих" фраз, а мы стали свидетелями нового масштабного апдейта. Мое мнение -
все свидетельствует о том, что причина не в этом. Хотя, если вы предоставите доказательства, я изменю свое мнение.
Стандартные результаты запросов изменились под воздействием вируса или сбоя в системе, и теперь их реальное положение в The Register можно увидеть только набрав -mt-tb.cgi в командной строке. Я полагаю,
здесь происходит нечто подобное тому, что мы делали ранее, добавляя к запросу -waffle (или любое другое мусорное слово). В данном случае мы
избавляем результаты запроса от инородных листингов от Blog, исключая из результатов поиска название наболее популярного отслеживающего
blog-скрипта.
Заключение
Несмотря на поднявшийся шум, нет повода предполагать наличие какого-то заговора. Google пытается изменить сложившийся
баланс путем устранения очевидных манипуляций с результатами наиболее популярных запросов. Вполне возможно, что Google выбрал
наиболее востребованные запросы путем количественной и стоимостной оценки запросов. Поэтому определенные виды сайтов не попали в
данную категорию. К примеру, сайты по оптимизации в поисковых системах могли оказаться востребованными, но не настолько, чтобы попасть
под действие фильтра.
Результаты действия фильтра, вполне возможно, удивили Google, но в настоящее время немногие сурферы что-либо замечают - не в
пример вебмастерам. Качество результатов изменилось, и запросы home alarm" ("домашняя сигнализация") , web design Calgary ("вебдизайн Калгари"), и medela breast pumpsвыдают, с переменным успехом, по первому запросу сайты, которые не имеют ничего общего с домашней сигнализацией, хоккейная
команда возглавляет список результатов по вебдизайну, а листинг результатов третьего запроса содержит, практически, только торговые
порталы. (Здесь я хочу поблагодарить тех, кто прислал мне некоторые из обнаруженных ими запросов). Мнения разделились: с одной стороны
считается, что произошло серьезное снижение релевантности результатов, а их оппоненты полагают, что подобные изменения обогатят опыт
сурферов. Вам решать, к какой стороне примкнуть!
Несомненно то, что Google проследит за результатами проведенных изменений, и подправит алгоритм, если это вознаградит
достойные сайты и увеличит релевантность ответов на запросы. Как бы там ни было, времена легкого получения высоких рейтингов в системе
Google путем простой оптимизации прошли.
Как обычно, приветствуются любые комментарии к этой статье, которые послужат основой для дальнейшего обсуждения
последнего апдейта Google. Все высказанные мнения принадлежат автору статьи и не обязательно разделяются Компанией.
© Barry Lloyd.
Источник | 8 декабря 2003