Блокнот Интернет Серфера

Онлайн-шоу мутации интернет серфера в блоговода и сайтовладельца. Мутирую путем проб и ошибок. Наблюдайте, чтобы не повторять их.
 
 


Яндексоводы открывают секреты поиска

поиск яндекса

В этом обзоре попробуем провести межстрочный алализ одного познавательного интервью, которое появилось 21 ноября сего года на просторах Рунета. Андрей Шипилов, автор сайта shipilov.com, совместно с сайтом roem.ru решил помучить сотрудников яндекса каверзными вопросами.

Собеседниками журналиста были:
Технический директор Яндекса Илья Сегалович.
Руководитель отдела веб-поиска Александр Садовский.
Руководитель группы отдела веб-поиска Сергей Певцов.

Много чего ребята нарассказали. Интервью получилось очень объемным. Спалили они темы или интервью было хитро спланировано и срежиссировано с тайной целью дезинформировать SEO-сообщество, гадать не будем. Предположим, что все сказанное чистой воды правда и откровение. Используя эту информацию проведем небольшой анализ интервью. Разумеется не полностью, а отдельных, наиболее важных частей.

Илья Сегалович: …«Некачественный» с нашей точки зрения сайт, то есть тот, к которому могут быть применены ограничительные меры, это сайт, который в силу тех или иных причин создает помехи в поисковой выдаче, мешает поисковой машине в ее работе, ибо в текущей модели ранжирования мы не можем его корректно отранжировать …

В переводе на язык SEO-шников, это звучит так.

Нечего пропихивать в топ по конкретному вопросу, обладающему хоть какой-то частотностью и конкурентностью сайты, не оптимизированные и не «заточенные» под этот запрос. Иными словами - сайт про матрешек, ни при каких бюджетах на продвижение, не попадет в топ по запросу о чебурашках. Более того, любая попытка помогать таким сайтам, тоже может привести к «ограничительным мерам».

В частности, в нашей системе оценок есть оценка «явная глупость» - когда ответ не просто нерелевантен, он вызывает у пользователя отторжение и удивление по поводу работы поисковой системы.

Ах, как же просто все получается у яндексоводов)))

Вот только мне интересно, как, например, они будут проверять на релевантность запрос «пушистые киски»? Ведь одни пользователи ожидают от этого запроса одного, а другие совсем другого, и еще не известно, каких любителей «пушистых кисок» больше и чьи ожидания сильнее не подтвердились.

У нас есть такая метрика: «Не выкидывать хорошие сайты».
Что мы делаем: по ряду запросов мы мониторим выдачу других поисковых машин, всех, кто хоть как-то ищет по-русски…

Так, записываем себе в блокнотик - хочешь хороших позиций по «вкусным» запросам в Яндексе - обязательно работай над позициями и в других системах.

…смотрим, какими метриками этот документ обрабатывался - вдруг он не попал в базу, потому что наши алгоритмы сочли его некачественным? Тут могут сыграть роль ссылки, которые на нем стоят, ссылки, которые на него ведут, дублированность контента, признаки сгенерированности текста, его неестественность - у нас много критериев. Мы считаем определенную сумму баллов, и когда сумма баллов превышает некий порог, мы сайт выбрасываем из поиска.

Опа, как же так? Что мы слышим? «Тут могут сыграть роль ссылки,…(skip)…, ссылки, которые на него ведут» А ведь любой SEO-гуру с пеной у рта станет Вас убеждать, что внешние факторы не влияют на позиции сайта. Оказывается, у яндекса на этот счет совсем другое мнение и для каждой аксиомы есть свои «НО»!

Что это значит? А это значит, что спамить сайты бесплатными методами следует с огромной осторожностью. Это значит, что лучше уж вообще никакой ссылочной массы для сайтов, которые планируется использовать в качестве ссылочных доноров, чем ссылки с бесплатных досок, заспамленых каталогов, социальных закладок и гостевых книг.

Специально для тех, кто продает в сапе - поясню. Экономически выгоднее иметь нулевой сайт без пузомерок, продающий строго модерируемые ссылки, в течение многих месяцев, чем сайт с пузом 1-2PR и 10-20тИЦ, поднятый спамом, продающий все подряд, который уйдет в бан через 2-3 апа выдачи.

…Конечно, отвечает не робот…

О как, со слов Сергея Певцова получается, что все наши письма к Платону читают живые люди. Но далее следует такой текст:

…при этом надо понимать, что на вопрос о типовой ситуации последует типовой ответ. Тут играет роль степень нашей уверенности, что мы поступили правильно. Если она у нас чрезвычайно высока, то, разумеется, нет смысла тратить много человеческих ресурсов…

И все-таки, автоматизация при ответах присутствует и велика вероятность, что не каждое письмо, как бы вы красиво не расписали в нем свои аргументы, будет прочитано человеком. Скорее всего, существует некая система фильтров, которая по ключевым словам в письме или(и) имени домена позволяет массово выделять шаблонные запросы и давать шаблонные ответы, в зависимости от причины пессимизации сайта.

Предположим, что такой почтовый фильтр существует. Как исхитриться и не нарваться на шаблонный ответ?

  1. Видимо не стоит отправлять запрос из панели вебмастера яндекса, привязка к домену и id сайта там 100% есть. Вообще-то, если сайт махровый дорвей, спам-каталог или саттелит для ссылок на основе синонимайзера, неочищенного скана или копипаста, нечего ему делать в панели вебмастера. Это мое сугубо личное мнение, кто не согласен - пользуйтесь панелью на здоровье, я предупредил.
  2. Видимо, не стоит указывать в письме адрес сайта в виде URL, возможно, имеет смысл даже «ошибиться» в написании домена, например, написав зону в виде *.ру а не *.ru
  3. Ежели вы намерены общаться с живым человеком - будьте предельно корректны. Четко и внятно излагайте свои аргументы и просьбы. Уж точно не стоит хамить и использовать нецензурную лексику.

…наша цель как раз и состоит в том, чтобы пользователь был доволен. И у нас есть средства, позволяющие оценить способность сайта решить ту или иную пользовательскую задачу, формализовать эту характеристику, обратить в цифры и использовать эти цифры при оценке качественности сайтов…

Возникает закономерный вопрос, как же Яндекс «видит, что пользователь доволен сайтом»?

Если Гугл, практически не скрывая, использует для целей ранжирования статистику из Google Analytics, показатель отказов, внутренние переходы и т.д., то у Яндекса столь мощной официальной системы статистики нет. А то, что есть из официального (Яндекс Метрика), такое хилое, что его можно в расчет не брать.

Зато в рунете сильно развиты «независимые» бесплатные системы статистики, лидером среди которых, бесспорно, является LiveInternet.  Будь я топ менеджером Яндекса, уже давно бы заключил с ними договор, пообещав за регулярный слив инфрмации о своих клиентах - ломтик пирога от Директа. Кто поручится, что такого договора нет? Я бы не стал утверждать, что слива информации не происходит. :о)

Короче, от греха подальше, можете считать меня параноиком, но я не ставлю НИКАКИЕ  сторонние счетчики на сайты созданные для поискового спама. С другой стороны, для «белых» сайтов, они напротив, могут оказаться полезными.

Ну и конечно, Яндекс вполне себе может отслеживать поведение юзеров по кукисам. Засекли переход на сайт, засекли возврат юзера к поиску по тому же запросу.

Сделали вывод - если большинство юзеров снова начинает искать то же самое после перехода из поиска, то сайт в поиске занимает не свое место. Надо понизить.

Если большинство народа ушло по ссылке надолго, а то и не вернулось вовсе, то пусть сайт болтается в топе и дальше.

Сергей Певцов: Еще раз подчеркну: уникальность контента совсем не определяющая вещь. О ней много говорят, но более важная характеристика - не уникальность, а полезность контента…(skip) …сейчас есть сканеры и программы распознавания текста, и это тоже средство заполнения сайтов уникальным контентом… (skip) … если все это не вычитывается, а прямо так, с ошибками распознавания, вываливается в интернет, дробится на мелкие абзацы, форматируется как попало, сверх меры обвешивается рекламой - вряд ли такой сайт будет полезен посетителю…

В общем, как и ожидалось, с точки зрения Яндекса - авторские права это проблемы авторов. Если скан оформлен как положено, если количество рекламы (в том числе и продажных ссылок) в пределах приличий, то такой саттелит будет «жить» в индексе долго.

Александр Садовский: Другой способ получения «уникального» контента - рерайтинг. Когда берется новость и переписывается, подбираются синонимы. Иногда это делается автоматически, программами-синонимайзерами… (skip)…Конечно, задача вычисления синонимизированного текста - это решаемая задача, мы можем во многих случаях это делать.

Перевожу - нам, яндексоводам, пофиг Ваши синонимайзеры. Какие бы Вы не создавали супер-пупер базы синонимов и мы все равно «спалим» автоматически синонимизированный текст.

Объясняю засаду.

1. Слабый синонимайз, а уж тем более тупой копипаст, легко фильтруется банальным «методом шинглов».

2. Граберы использующие продвинутые алгоритмы синонимизации и узко-специализированные базы синонимов вычисляются с использованием «Законов Зипфа»

Для тех, кто поленится мучить поисковик по запросу «Законы Зипфа» и «метод шинглов», вкратце объясняю:

Первый закон Зипфа “ранг - частота”

Произведение вероятности обнаружения слова в тексте на его ранг частоты (ранг частоты наиболее частого слова равен 1) - константа.

Формула:

(Количество вхождений слова x ранг частоты) / Число слов = const (величина постоянная)

Второй закон Зипфа “количество - частота”

Форма кривой зависимости частоты и количества слов, входящих в текст с этой частотой, одинакова для всех текстов.

Примечание: Законы Зипфа дают более точные результаты при анализе больших текстов.

Чтобы не грузить читателей излишними научными выкладками, по секрету сообщу, что алгоритмы поисковиков уже давно используют и «метод шинглов» и «Законы Зипфа».

Таким образом, сайт большого размера, состоящий из абсолютно уникального контента, чтобы такой контент считался «человеческим» и устроил по этим параметрам поисковик, может создать только человек.

Именно поэтому поисковые роботы «любят» многостраничные сайты состоящие из больших статей с уникальным контентом. Просто, чем больше материала для анализа, тем проще алгоритмам поисковиков определить, сгенерирован текст автоматически или нет.

Поясню еще раз для ярых адептов программ-сининимайзеров. Даже если синонимайзер или программа для размножения статей выдает тексты с 80-99% уникальности, то писать как человек она все равно не сможет. Когда Вам удастся создать синонимайзер, который пишет тексты так же как и человек, можете смело претендовать на нобелевскую премию, потому, что такие тексты может писать только Искусственный Интеллект мало отличающийся от человеческого.

Александр Садовский: Действительно, задача определения оригинала - очень сложная… (skip)…мы можем сказать себе, что велика вероятность того, что этот документ является первоисточником, но гарантии пока дать не можем.

Тут ничего нового, мы и так давно в курсе, что Яндекс точно не определяет первоисточник статьи, то есть, если Ваш сайт постоянно и нагло «грабят», то существует совсем не слабая вероятность, что робот признает Вас за копипастера, а вора за автора и не понизит траст Вашему ресурсу.
На вопрос, Андрея Шипилова, а «чего делать, кого хватать, куда бежать и кому жаловаться». Был дан простой и недвусмысленный ответ - если Ваш контент такой крутой, что его украли, то продолжайте и дальше творить, не отвлекаясь на воров и в конце концов, когда ни будь, Вас заметят.

Часть 5. Политика борьбы с поисковым спамом.

Много всякого разного было сказано про продажные ссылки и про поисковый спам, коротко это сводится к тому, что любые схемы направленные на искусственное повышение сайта в выдаче пресекались и будут пресекаться Яндексом вплоть до бана участников схем. Если хотите заниматься коммерцией - несите денежки в Яндекс-Диррект и будет Вам счастье в виде целевых посетителей-клиентов.

Итог: Вот вроде бы и все основные моменты, на которые следовало обратить внимание в интервью. Не то чтобы яндексоводы сказали что-то новое, нет, о многом SEO-шники либо догадывались раньше, либо вычислили эмпирическим способом. Не это главное.

Главное то, что некоторые вещи, озвученные официальными лицами Яндекса, наконец-то можно перевести из категории непроверенных догадок в категорию подтвержденных фактов. Однако, следует помнить, что нравится нам это или нет, все правила устанавливает Яндекс и он же может их поменять в любой момент, если это сочтет нужным. Нам остается лишь подстраивать под эти правила свои сайты, для достижения лучших результатов.

PostScriptum:
Кстати, если не получается перехитрить Яндекс, может не стоит себя мучить. Может быть создавать и двигать сайты это не ваше? Поверьте, есть надомная интернет работа и попроще. Если и на этом сайте не найдете ничего по душе и по карману, то обязательно полистайте журнал работа и зарплата, вакансии. Возможно там что-то подберете.
Не забудьте про то, что делу время, а потехе час. И этот час можно потратить на то чтобы почитать обзоры фильмов. Лучше потратить час на чтение обзоров, чем несколько часов на просмотр пропиаренного кино-бреда.

PostScriptum2: Ах да, тут я озадачился вопросом, а почему это на моем блоге не появляются трэкбэки? Оказалось, просто они отключены по умолчанию. А для включения трекбэков нужно либо задать разрешение явно в настройках, либо ставить в каждой статье галочку “Разрешить отклики”. Собственно, что я сейчас и сделал. Попробую протестировать эту фишку вордпресса. Приглашаю Всех желающих принять участие в тестировании.
А чтобы Вам было интереснее принимать участие в тестировании, автор первого блога, чей трекбэк появится здесь, получит один полноценный WMZ. Для этого Вам нужно в своем посте упомянуть эту статью, а дальше дело техники. Чтобы получить честно заработанную тестированием денежку - как обычно, пишем на почту.


Похожие статьи:


Введите свой email, чтобы получать новые статьи этого блога почтой:

  

На сообщение “Яндексоводы открывают секреты поиска” комментариев: 6

  1. richkeeper:

    Лучше потратить час на чтение, чем просмотр фильма??? У тебя что телевизор не работает или ты так принципиально не любишь кинематограф?? Нельзя так, каждый выбирает для себя то, что ему по душе. Во вкусах не спорят…

  2. ISurfer:

    richkeeper,
    Еще раз перечитайте так возбудивший Вас абзац.
    Не торопитесь.
    Постарайтесь вникнуть в смысл.
    Он четко изложен.

    Если смысл все еще не понятен. Поясняю. Речь не о преимуществах чтения перед кинематографом. Речь о том, что следует читать обзоры для того, чтобы не тратить время на просмотр ерунды.

    Теперь обо мне, раз уж перешли на личности.
    Скорость чтения позволяет мне в течение часа прочесть пару десятков обзоров и получить общее представление 5-6 фильмах. Для одного фильма, в целом, достаточно прочесть 3-4 отзыва.

    Допустим, заинтересовался я фильмом “2012″, параллельно отыскал упоминание о фильме “2012: Ссудный день”. Прочитанные рецензии позволили сделать вывод, что
    1. фильм 2012: Сценарий, редкостный бред, но спецэффекты на уровне. Чтобы получить удовольствие от фильма, следует смотреть его на хорошей аппаратуре или в приличном кинозале. Просмотр DVDрипа - потеря времени.
    2. фильм 2012: Ссудный день: Вообще смотреть не стоит, если не помешан на религии.

  3. CPU:

    Хотел сказать просто - спсибо, но знаю, что в наше время - это катит за спам. )) Поэтому добавлю - инфа чертовски полезна для размышления…. э -ээ… Спасибо! :)

  4. CPU:

    Кстати, факт дружбы Яндекса и LiveInternet, вроде, уже - доказанный факт. Вот только не помню, у кого видел пост по теме.

  5. 456:

    Olga

    Otkuda material ?

  6. ISurfer:

    В первом абзаце поста - ссылки на источники.

Оставить комментарий

*
Для подтверждения, что Вы человек (а не спам-скрипт), нужно решить простое математическое задание. Если Вам необходимо, то нажав на картинку Вы можете прослушать аудио-файл задания на которое нужно ответить.
	Нажмите, чтобы услышать аудио-файл анти-спам уравнения