Яндекс и поисковая оптимизация. Это достигается тем что биржа использует систему яндекс xml которая проводит
|
|
| ||||||
|
|
| ||||||
|
|
| ||||||
|
|
| ||||||
|
|
| ||||||
|
|
| ||||||
|
|
| ||||||
|
|
| ||||||
|
|
yandex.ru
Компания Яндекс — Принципы — Яндекс и поисковая оптимизация
Основная задача Яндекса — давать ответы на вопросы. Что только не ищут пользователи в сети — материалы для подготовки к экзамену и ответы на кроссворды, дату приближающейся выставки и почтовый индекс и даже любимую или любимого.
Значительную часть запросов составляет поиск товаров и услуг. Среди множества сайтов с товарами и услугами поисковой системе нужно найти и предложить пользователям наиболее качественные — удобные, информативные и авторитетные. Понятно, что все эти характеристики субъективны, а поисковый алгоритм может использовать только измеримые параметры. Анализируя сотни таких параметров, поисковая система вычисляет значение релевантности страницы — то есть определяет, насколько качественно страница отвечает на запрос.
Конечно, компании, предлагающие товары или услуги в сети, хотят привлечь пользователей поиска и оказать им ту самую искомую услугу или продать товар. Для этих целей они проводят так называемую оптимизацию сайта — мероприятия, позволяющие улучшить представление сайта в результатах поиска и повысить его эффективность как инструмента бизнеса.
Существуют разные подходы к оптимизации. Например, можно делать сайт более информативным, интересным и удобным — то есть оптимальным для пользователя. Такая оптимизация требует работы над содержанием сайта, креативности, понимания интересов бизнеса и клиентов, большого опыта и знаний. Это непростой способ, но он позволяет завоевать заслуженную популярность у пользователей и высокие позиции в результатах поиска.
Другой подход заключается в том, что результаты поиска рассматриваются как рекламная площадка, где можно оказаться вне зависимости от качества сайта. Такой подход (назовем его «псевдооптимизацией») реализуется в попытках обмануть поисковую систему и искусственно повысить позицию ресурса в результатах поиска, влияя на параметры, которые используются при ранжировании.
С помощью искусственных способов оптимизации можно ненадолго ввести поисковую систему в заблуждение. Однако формула ранжирования, реагируя на изменения в сети, постоянно изменяется и совершенствуется. Неестественное завышение (накрутка) факторов теряет силу, и сайт возвращается на заслуженное место в выдаче. Как и в других сферах деятельности, псевдооптимизация в конечном счете всегда проигрывает настоящему улучшению качества.
Один из наиболее популярных способов псевдооптимизации — это использование SEO-ссылок, которые на коммерческой основе размещаются на сторонних ресурсах (количество ссылок на страницу и их текст учитываются при ранжировании). Спрос на SEO-ссылки стимулирует наводнение интернета сотнями тысяч бесполезных сайтов, забитых заимствованным или бессмысленным контентом. При этом ценность этих ссылок для улучшения качества поиска существенно снижается.
Еще один способ искусственного продвижения своего ресурса в результатах поиска — это переоптимизация текстов. В этом случае в размещенный на странице текст стараются поместить как можно больше ключевых слов, чтобы страница занимала более высокие позиции в результатах поиска по этим словам. При этом сама страница становится неудобной для восприятия, и пользователь часто покидает такой ресурс.
Иногда для привлечения посетителей используют промежуточные странички (дорвеи), которые появляются в результатах поиска по низкочастотным запросам и перенаправляют трафик на нужный сайт. В результате, в интернете появляется большое количество страниц, где нет никакой полезной для пользователя информации. На дорвее пользователь не может найти ответ на свой вопрос и только напрасно тратит время. Поисковые системы исключают дорвеи из результатов поиска.
В конечном итоге, искусственная оптимизация не приводит к желаемому результату. Даже если владельцу сайта удается на какое-то время продвинуть свой ресурс в результатах поиска, его действия вредят другим людям и экологии сети в целом. Пользователям поиска становится труднее найти ответ на свой вопрос, а в интернете появляется большое количество мусорного контента. Яндекс рассматривает подобные методы псевдооптимизации как разновидность поискового спама (п.3.7 Лицензии на использование поисковой системы Яндекса). Их использование может негативно отразиться на оценке сайта поисковой системой.По мнению Яндекса, единственно правильный способ повысить эффективность своего сайта — это постоянно работать над улучшением его качества и удобства для пользователей.
Чтобы сайт нравился пользователям, необходимо, как минимум:
- создавать привлекательный дизайн,
- повышать удобство интерфейсов,
- наполнять сайт полезной информацией.
Такая оптимизация поможет сайту занимать достойные места в результатах поиска и привлечь посетителей, которые могут стать его клиентами.
yandex.ru
Компания Яндекс — Технологии — Архитектура ответа на вопрос
Каждый день пользователи задают Яндексу десятки миллионов запросов, и поисковая система должна не только точно отвечать, но и быстро обрабатывать весь этот поток. Для этого Яндекс использует заранее подготовленные данные — индекс. Безусловно, поиск с помощью индекса ускоряет процесс ответа пользователю, как, например, предметный указатель в книге помогает быстрее найти нужное слово. Но размеры самого «предметного указателя» в поиске — огромны. Чтобы обрабатывать такие объемы данных и делать это быстро, Яндекс использует тысячи серверов. Сервера объединены в кластеры и даже в кластеры кластеров.
Архитектура поиска Яндекса устроена так, что к уже существующим серверам можно легко добавлять новые — для новых данных из постоянно растущего интернета.
Все пользовательские запросы сначала попадают в компьютерную систему «метапоиск». Метапоиск обрабатывает каждый запрос в реальном времени — выясняет все необходимые данные про запрос (из какого региона он был задан, к какому классу относится и т.п.), проводит лингвистическую обработку. Затем метапоиск проверяет, формировались ли в последнее время результаты поиска для этого запроса. Результаты поиска по часто задаваемым запросам некоторое время хранятся в памяти метапоиска, а не формируются каждый раз заново. И если вновь пришедший запрос оказался популярным, метапоиск покажет пользователю заранее сохраненные результаты.
Если же ответа в памяти нет, то метапоиск передаёт запрос на сервера другой компьютерной системы — «базового поиска». На базовом поиске хранится слепок интернета, по которому ищет Яндекс, — поисковая база. Она разбита на части, которые хранятся на разных серверах — искать ответ одновременно по нескольким частям базы данных быстрее, чем по всей базе целиком. Кроме того, у каждого сервера есть несколько копий. Это позволяет распределять нагрузку и не терять данные — если один из серверов не сможет своевременно ответить, информация всё равно найдется на дублирующих серверах. Из тысяч серверов базового поиска метапоиск выбирает наименее загруженные – таким образом, чтобы вместе они содержали целую поисковую базу.
Каждый из серверов отдаёт список документов, в которых есть слова из запроса, обратно в метапоиск. Там они объединяются, ранжируются с помощью технологии и попадают на страницу результатов поиска.Благодаря такой организации поиск Яндекса может отвечать пользователю за доли секунды.
yandex.ru
Компания Яндекс — Принципы — Принципы ранжирования поиска Яндекса
Интернет состоит из миллионов сайтов и содержит экзабайты информации. Чтобы люди могли узнать о существовании этой информации и воспользоваться ей, существуют поисковые системы. Они реализуют право человека на доступ к информации — любой информации, которая нужна в данный момент. Поисковая система — это техническое средство, с помощью которого пользователь интернета может найти данные, уже размещенные в сети.
Пользователи ищут в интернете самые разные вещи — от научных работ до эротического контента. Мы считаем, что поисковая система в каждом случае должна показывать подходящие страницы — от статей по определенной теме до сайтов для взрослых. При этом она просто находит ту информацию, которая уже есть в интернете и открыта для всех.
Яндекс не является цензором и не отвечает за содержание других сайтов, которые попадают в поисковый индекс. Об этом было написано в одном из первых документов компании «Лицензия на использование поисковой системы Яндекса», созданном еще в 1997 году, в момент старта www.yandex.ru: «Яндекс индексирует сайты, созданные независимыми людьми и организациями. Мы не отвечаем за качество и содержание страниц, которые вы можете найти при помощи нашей поисковой машины. Нам тоже многое не нравится, однако Яндекс — зеркало Рунета, а не цензор».Информация, которая удаляется из интернета, удаляется и из поискового индекса. Поисковые роботы регулярно обходят уже проиндексированные сайты. Когда они обнаруживают, что какая-то страница больше не существует или закрыта для индексирования, она удаляется и из поиска. Для ускорения этого процесса можно воспользоваться формой «Удалить URL».В ответ на запрос, который пользователь ввел в поисковой строке, поисковая система показывает ссылки на известные ей страницы, в тексте которых (а также в метатегах или в ссылках на эти сайты) содержатся слова из запроса. В большинстве случаев таких страниц очень много — настолько, что пользователь не сможет просмотреть их все. Поэтому важно не просто найти их, но и упорядочить таким образом, чтобы сверху оказались те, которые лучше всего подходят для ответа на заданный запрос — то есть, наиболее релевантные запросу. Релевантность — это наилучшее соответствие интересам пользователей, ищущих информацию. Релевантность найденных страниц заданному запросу Яндекс определяет полностью автоматически — с помощью сложных формул, учитывающих тысячи свойств запроса и документа. Процесс упорядочивания найденных результатов по их релевантности называется ранжированием. Именно от ранжирования зависит качество поиска — то, насколько поисковая система умеет показать пользователю нужный и ожидаемый результат. Формулы ранжирования строятся также автоматически — с помощью машинного обучения — и постоянно совершенствуются.
Качество поиска — это самый важный аспект для любой поисковой системы. Если она будет плохо искать, люди просто перестанут ей пользоваться.
Поэтому мы не продаем места в результатах поиска.
Поэтому на результаты поиска никак не влияют политические, религиозные и любые другие взгляды сотрудников компании.
Пользователи просматривают страницу результатов поиска сверху вниз. Поэтому Яндекс показывает сверху, среди первых результатов, те документы, которые содержат наиболее подходящие пользователю ответы — то есть наиболее релевантные заданному запросу. Из всех возможных релевантных документов Яндекс всегда старается выбрать наилучший вариант.
С этим принципом связано несколько правил, которые Яндекс применяет к некоторым типам сайтов. Все эти правила работают полностью автоматически, их выполняют алгоритмы, а не люди.
1. Существуют страницы, которые явно ухудшают качество поиска. Они специально созданы с целью обмануть поисковую систему. Для этого, например, на странице размещают невидимый или бессмысленный текст. Или создают дорвеи — промежуточные страницы, которые перенаправляют посетителей на сторонние сайты. Некоторые сайты умеют замещать страницу, с которой перешел пользователь, на какую-нибудь другую. То есть когда пользователь переходит на такой сайт по ссылке из результатов поиска, а потом хочет снова вернуться к ним и посмотреть другие результаты, он видит какой-то другой ресурс.
Такие ресурсы не представляют интереса для пользователей и вводят их в заблуждение — и, соответственно, ухудшают качество поиска. Яндекс автоматически исключает их из поиска или понижает в ранжировании.
2. Бывает, что в том или ином документе есть полезная информация, но воспринимать ее сложно. Например, есть сайты, которые содержат popunder-баннеры (они перемещаются по экрану вслед за прокруткой страницы и закрывают ее содержание, а при попытке закрытия такого баннера открывается новое окно) и clickunder-рекламу (она неожиданно для пользователя открывает рекламную страницу при любом клике по сайту, в том числе — по ссылкам). С нашей точки зрения, оба этих вида рекламы мешают навигации по сайту и нормальному восприятию информации. Поэтому сайты с такой рекламой располагаются в поисковой выдаче ниже, чем сайты, на которых пользователь может найти ответ на свой вопрос без лишних проблем.
3. По запросам, которые не подразумевают явно потребность в эротическом контенте, Яндекс ранжирует сайты для взрослых ниже или вообще не показывает их в результатах поиска. Дело в том, что ресурсы с эротическим контентом часто используют достаточно агрессивные методы продвижения — в частности, они могут появляться в результатах поиска по самым разнообразным запросам. С точки зрения пользователя, который не искал эротики и порнографии, «взрослые» результаты поиска нерелевантны, и, к тому же, могут шокировать. Более подробно об этом принципе можно почитать здесь.4. Яндекс проверяет индексируемые веб-страницы на наличие вирусов. Если обнаружилось, что сайт заражен, в результатах поиска рядом с ним появляется предупреждающая пометка. При этом зараженные сайты не исключаются из поиска и не понижаются в результатах поиска — может быть, на таком ресурсе находится нужный пользователю ответ, и он все равно захочет туда перейти. Однако Яндекс считает важным предупредить его о возможном риске.
Основная метрика качества поиска Яндекса — это то, насколько пользователю пригодились найденные результаты. Иногда по запросам пользователей невозможно определить, какой ответ ему подойдет. Например, человек, задавший запрос [пушкин], возможно, ищет информацию о поэте, а возможно — о городе. Точно так же человек, который набрал запрос [iphone 4], может быть, хочет почитать отзывы и ищет форумы, а может быть, хочет купить и ищет магазины. Среди первых результатов поиска должны найтись ответы для всех случаев. Поэтому Яндекс старается сделать страницу результатов поиска разнообразной. Поиск Яндекса умеет определять многозначные запросы и показывает разнообразные ответы. Для этого используется технология «Спектр».yandex.ru