КЛИПЫ: Godsmack
SEIL Если я не ошибаюсь, твой ник - абрездкпура. S - Салли, Е - Зрна, а дальше., f. L. Если я не прав - поправь. Если прав - дополни.
forum.a1tv.ru/index.php?topfc=36059.20 Сохраненная копия Еще с сайта
Рис. 6.4. Предложение исправить ошибочный вариант запроса на правильный после ввода запроса
куда приводят мечты куда пойти учиться куда вложить деньги куда поехать отдыхать куда пойти куда пойти 1 москве куда пойти в киеэ® куда поступать куда сходить в москве куда поехать в июле
Поиск в 6оод!е | Мне повезет! |
Рис. 6.5. Подсказки при вводе поискового запроса
Учет региона, из которого задан поисковый запрос
Один и тот же запрос, заданный пользователями из разных городов, может означать поиск разных сайтов. Так, очевидно, что с помощью запроса «доставка суши на дом» москвичи ищут сайты московских фирм, а казанцы — казанских.
С 2009 года поисковые системы стали учитывать город (регион), из которого посту- пил поисковый запрос. Они делают это не для всех запросов, а только для запро- сов, где это необходимо, по мнению поисковой машины. Такие запросы называют геозависимыми. Введение регионального поиска значительно улучшило качество поиска.
Поиск Почта Карты Маркет Новости Словари Бпоги
;|доставка суши Г в найденном Г в Казани
Все дбьяддмша в Доставка суши о.т Терияки
Доставка суши и пиццы. Каждому клиенту 10% карга е подарокі
С Адрес и телефон teriyaki.ru
I Small Tolw - Доставка роллов
| Свежие вкусные суви и роллы, шашлык, пицца с доставкой по Казани. Быстро!
* С Адрэс и телефон emalllokyo.ru Казань
1 Ш Авто -суши "Японка" Казань - заказ суши, доставка суши
Еашы Запеченные подлы Ассорти Сливочные «ши Сашкми
Посмотрите наши предложения на сайте, почитайте описания, выбирайте то, что понравится, и
складывайте в корзинку или звоните, как Вам удобнее. Доставка суши и авто-суши для нас - не
Яндекс
Нашлось 3 млн страниц
| обязанность, а приятная ежедневная работа.
yaponka.su Казань ШСШ еша
Рис. 6.6. Ссылка на казанский сайт в выдаче по запросу «доставка суши», сделанному из Казани
Поиск Почта Карты Маркет Новости Словари Блоги
Г"
роставка суши
Г в найденном J"1 в Санкт-Петербурге
| Яндекс
Нашлось 3 млн страниц
бее давления 17
Доставка суши "2 Берега"
Крупные и красивые фото суши, продуманная система заказа, сохранение данных
«uahl.2-berega.ru
Доставка суши от Терияки
Доставка суа» и пиццы. Каждому клиенту 10% карта е подарокі
С Адрес и телефон teriyaki.ru
| Заказ и доставка суши роллов СП6І
I Заказ вкусных суши роллов. Доставка суши за час. Все районы, Вкусные цены!
£ o-hasi.ru
Рис. 6.7. Тот же запрос сделан из Санкт-Петербурга. В выдаче — сайт петербургской компании
Элементы искусственного интеллекта, такие как исправление ошибок, подсказки, учет региона и др., у многих пользователей вызывают ощущение, что поисковик буквально «понимает» их вопросы (рис. 6.6,6.7).
6.5. Качество поисковой машины
В отношении поисковых машин очень часто можно слышать качественные оценки. «Я пользуюсь «Яндексом», потому что он лучше ищет!», «Гугл круче всех» — до- вольно распространенные высказывания.
Что же такое качество поисковика? Обычно синонимом качества поиска считается его релевантность.
Что такое релевантность
В отношении поисковых машин слово релевантный - чуть ли не главный термин. «Релевантная выдача», «релевантные результаты», «у поисковика X релевантность выше, чем у поисковика К» — такие фразы можно слышать постоянно. Что они означают?
Как уже говорилось выше, релевантный — значит относящийся к делу. Релевант- ность результатов поиска поисковой машины означает, что они содержат страницы, относящиеся к делу, то есть к смыслу поискового запроса.
Такое определение релевантности выглядит очень простым. Казалось бы, из него сле- дует, что если мы введем поисковый запрос и если среди первых результатов поиска окажутся только релевантные сайты, то выдача поисковой машины будет релевантна. Однако это не совсем так. Давайте разберемся с этим вопросом подробнее.
Не существует релевантности вообще, в вакууме. Ведь кто-то должен определить, действительно ли сайты соответствуют тому, что предполагалось в запросе. Кто? Очевидно, лучше всего это может сделать сам автор запроса, который ввел его в поисковую машину.
И вот здесь возникает несколько проблем. Ведь не очень интересно обсуждать запросы выдуманные, введенные для эксперимента. В «Яндексе», Mail.ru, Google есть десятки миллионов популярных запросов, которые ежедневно вводят реальные пользователи. А с ними далеко не все так ясно.
Во-первых, большинство запросов — однословные или двухсловные, то есть очень лаконичные. Ясно, что далеко не всегда они полностью отражают смысл искомой страницы. Значит, какие-то условия поиска всегда остаются в уме пользователя недосказанными.
Во-вторых, ни поисковик, ни мы с вами не можем знать, что происходит в уме реально- го пользователя, вводящего конкретный запрос. Что он на самом деле имел в виду?
В-третьих, у популярных запросов очень много «соавторов» — их вводят совершен- но разные люди. Всегда ли они имеют в виду одно и то же — неизвестно. Скорее всего, нет.
Например, что означает запрос дизайн? Что имел в виду автор — веб-дизайн, дизайн квартир, ландшафтный дизайн или промышленный? А что делать, если разные авторы этого запроса имели в виду разное?
Итак, можно сформулировать следующее утверждение: сам по себе поисковый запрос принципиально неполон. Почти всегда существует не высказанное пользо- вателем явно, но важное для него условие релевантности запроса.
Условие релевантности
Условие релевантности — это не входящее в запрос предположение пользователя о том, какие страницы будут релевантным ответом на запрос. Фактически — это скрытая постановка задачи поиска в уме пользователя.
Например, если пользователь вводит запрос «ногу свело», то в большинстве случаев таким условием релевантности является имеющееся в уме пользователя дополни- тельное ограничение на поиск — «музыкальная группа».
Значит, большинство пользователей поисковика, задавшие запрос ногу свело, имеют в виду именно музыкальную группу и будут довольны, если поисковая машина по запросу ногу свело выведет их прямиком на сайт группы «Ногу свело», на ее по- следний диск или еще на что-то, связанное с этой музыкальной группой. Заметим, что пользователь, как правило, держит это условие релевантности в уме, не сообщая его поисковику[6].
А тот редкий несчастный пользователь, у которого действительно свело ногу и ко- торый хочет узнать в Интернете, что делать в таком случае, скорее всего вообще не получит никакой информации на первых страницах выдачи. Выдача будет забита ссылками на разные аспекты деятельности группы «Ногу свело», и ему придется как-то дополнительно уточнять свой «медицинский» запрос.2
Условие релевантности в уме пользователя прямо зависит от его намерений, от цели запроса, от того, что вообще хочет сделать пользователь с найденными по запросу сайтами.
Цели и типы поисковых запросов
Все пользователи очень разные, и приходят они в Интернет с совершенно разными целями. Поэтому запросы, которые вводят пользователи в поисковые машины, также отличаются по своим целям (рис. 6.8). Заранее знать и понимать эти цели довольно важно как для поисковой машины, так и для тех, кто хочет привлекать посетителей на свой сайт.
Ниже описаны основные типы запросов.
Поиск Почта Карты Маркет Новости Сло-вари Блоги Видео Картинки ещй т
статистика
20 последних запросов пользователей Яндекса:
ДТП возле крылатского моста (30197)
ИИШВНЫ 53600 (2543701)
КУПИТЬ мансардные окна (751177)
гШШЕШКШ (43627)
^ЙШа (1412374)
аккопды враг мой бойся меня (264189)
рзмбпер игры (12740420)
тесты по истории а колледже (972000)
волна кпилаот (4212)
КЛЮЧИ ДЛЯ оо<ВД (6636761)
Березовский Филиал ГП КрайДЭО (221)
спальня ме^ль (13448388) школа 2033 москаа (522535) иринэ Медведева (2057546) переводчик (34864536)
и Статистика запросов В Дзем-поиск
| сайт серебряного дождя (2995662) петс май пипл гоу скачать (483)
(71308)
Следующие 20 запросов -
р ДИПШИ Статисти» - Рецпама
Рис. 6.8. «Прямой эфир» поисковых запросов в «Яндексе» — в реальном времени отображаются самые разные запросы, которые посетители задают в поиске
Навигационные запросы
Это один из самых распространенных видов запросов. Такие запросы вводят пользо- ватели, которые хотят найти конкретное место в Сети — сайт нужной им компании или полезного им форума, ссылку на блог интересной персоны и т. п.
Таким образом, если пользователь ввел запрос наподобие Администрация Президен- та, то скорее всего он хочет получить ссылку на сайт Администрации Президента, Аналогичное утверждение с большой вероятностью можно отнести и к запросам вида Вимбилъдан или Аэрофлот.
Аудитория, которая приходит на ваш сайт по навигационным запросам, скорее всего уже знает ваш бренд, сайт, услугу. Либо пользователь зашел к вам по ошибке.
Конечно, точную цель запроса знает только пользователь, который ввел этот запрос. К сожалению, подавляющее большинство пользователей не очень опытны в обра- щении с поисковиками и не умеют формулировать запросы так, чтобы получить наилучший результат. Поэтому не исключено, что конкретный запрос Аэрофлот представляет собой не очень удачную попытку получить расписание рейсов или желание купить билет.
Тогда это информационный или транзакционный запрос.
Информационные запросы
Информационный запрос вводят, когда хотят найти какие-то сведения, информацию в Сети, причем пользователю все равно, где именно она находится.
Примерами информационных запросов могут служить:
□ поиск телефона нужной организации (в данном случае подойдет сайт любого справочника);
□ желание получить сведения по истории Древнего Рима или выяснить удельный вес ртути (здесь сгодится любой более-менее серьезный научный сайт или он- лайновая энциклопедия);
□ запрос о результатах финального матча чемпионата мира или поиск последних сведений об очередной вспышке напряженности на Ближнем Востоке (в данном случае пригодится любая свежая новость по заданной теме, независимо от того, где она опубликована);
□ запрос типа руководство к очистителю воздуха Дайкин или Расписание полетов Аэрофлота (здесь пригодится любой авторитетный источник).
Ясно, что пользователи, сделавшие информационные запросы, наиболее интересны тем владельцам сайтов, которые делают ставку на показ посетителям какого-то интересного им содержания, справочной информации или уникальных сведений.
Транзакционные запросы
Как мы уже говорили, массовому пользователю свойственно вводить недоопреде- ленные, нечеткие, самые общие запросы, поэтому поисковику, ориентированному на формальные признаки, трудно понять, что имеется в виду, когда введен, например, запрос пластиковые окна.
Но нам-то с вами более-менее ясно, что здесь, вероятно, имеется в виду не общая теория создания пластиковых окон или конкурс дизайна пластиковых окон в Париже. Этим запросом пользователь скорее всего выражает желание выбрать и установить окна у себя в квартире, так что это — не информационный, а транзакционный запрос.
Транзакционным является такой запрос, который вводит пользователь, желающий совершить в Интернете какое-то действие — транзакцию (т. е. купить, заказать, скачать, подписаться или заплатить). Таковы, например: антивирус скачать, ус- тановка кондиционеров, летний лагерь под Москвой и тому подобные конкретные, «деловые» запросы.
Ясно, что транзакционные запросы наиболее интересны для тех владельцев сай- тов, у которых уже есть готовая структура для продажи товаров или услуг через Интернет.
Нечеткие запросы
И конечно же, есть огромная «серая зона», обширная категория нечетких, слишком общих запросов, которые вводят в поисковиках неопытные или ленивые пользо- ватели. Например, какую цель преследуют запросы типа квартира, кондиционер, окна, мобильник? Это точно не навигационные и скорее всего не информационные, а транзакционные запросы. Но наверняка сказать этого нельзя.
Сделаем общее замечание о «качестве» запроса, которое пригодится в дальней- шем.
С одной стороны, нечеткие, то есть самые общие, запросы наподобие билеты, квартира, кондиционер, окна, как правило, кажутся наиболее привлекательными владельцам сайтов. Очень часто руководители фирм желают видеть свой сайт на первом месте в поисковиках именно по этим запросам. Если фирма строит бассейны, ее генеральный директор обычно хочет быть первым в «Яндексе» и Google именно по запросу бассейны. А директор агентства недвижимости — по запросу квартира.
Именно поэтому по самым общим запросам обычно имеется наиболее высокая конкуренция как в продвижении сайтов, так и в контекстной рекламе.
С другой стороны, аудитория при таком запросе может быть очень неоднородной, смешанной, потому что общий запрос может подразумевать самые разные цели и типы запросов. Например, что на самом деле означает запрос квартира? Чего хотел автор запроса — купить, продать, арендовать, сдать? Может, ему вообще нужна ипотека или ремонт? И стоит ли тратить много ресурсов на этого пользователя с его неизвестными целями?
В последующих главах мы покажем, что для продвижения своих услуг в областях с высокой конкуренцией часто гораздо эффективнее заниматься более точными, низкочастотными, многословными запросами.
Зачем нужно знать тип запроса
Зачем нужно понимать, по запросам какого типа пользователи заходят на ваш сайт? Затем, что, только зная ожидания посетителей сайта, их можно обслужить наиболее качественно. Например, если человек зашел к вам на сайт по информационному запросу, не стоит пытаться сразу же заставить его купить товар — он просто уйдет со страницы в раздражении. Напротив, нужно сначала предложить ему искомую информацию (и чем более полной она будет, тем выше вероятность удержать по- сетителя на сайте) и только затем — соответствующую услугу или товар.
Наоборот, посетитель, сделавший транзакционный запрос, больше всего будет ин- тересоваться условиями транзакции — ценой, сроками, доставкой, скидкой и т. п. И он будет рассчитывать сразу же найти эти условия на странице, окинув ее одним взглядом.
Заметим, что все поисковые машины по-разному работают с разными типами за- просов. Поскольку, не прочитав мысли пользователя, поисковик не может точно установить цель, то есть тип запроса, то на качество обработки разных типов запро- сов влияют скорее общие особенности поисковых алгоритмов каждого поисковика.
Извне оценить эти отличия можно только приблизительно, статистически. Напри- мер, известно, что Google лучше всего справляется с навигационными запросами, это его конек. А «Яндекс» более силен в обработке информационных запросов.
А что вообще такое «лучше справляется», что значит утверждение, что поисковая машина «лучше ищет»?
Полнота и точность
Мы выяснили, что запросы к поисковым машинам могут быть совершенно разных типов и что большинство запросов имеет неявное условие релевантности, которое не присутствует в самом запросе, а находится в уме пользователя. В общем, реле- вантность, она же качество поиска, — довольно сложная вещь.
Как же оценить качество работы поисковика с запросами? Для этого применяются понятия, традиционные для задач поиска информации, — полнота и точность.
Полнота
Полнота поиска — это мера того, нашел ли поисковик все нужные веб-страницы, которые есть в Сети. Проще всего вычислять полноту в процентах от всех реле- вантных запросу страниц. Например, если в Интернете есть 100 тысяч страниц, посвященных группе «Ногу свело», а поисковик нашел лишь 65 тысяч из них, «не заметив» остальные по тем или иным причинам, то полнота будет равна 65%.
Заметим, что из данного, вполне жизненного примера видно, что полнота поиска не очень-то интересна обычному пользователю интернет-поисковика. Ведь в Сети всегда слишком много данных. Все равно невозможно просмотреть ни 100 тысяч страниц, ни 65 тысяч...
А ведь поисковик показывает данные постранично — первые десять найденных страниц, потом еще десять и т. д. Большинство обычных пользователей (до 80%) не заглядывают дальше первой-второй страницы результатов поиска, просматри- вая только первые 10-20 ссылок. Поэтому не очень важно, сколько релевантных результатов (десять тысяч, сто тысяч или миллион) осталось за пределами первых страниц результатов поиска или вообще не было найдено в Сети. И того, что най- дено, за глаза хватит.
Поэтому основным показателем качества работы интернет-поисковика является его точность.
НЕ ПОЛНОТА, А РАЗНООБРАЗИЕ______________________________________
На самом деле полнота поиска — очень важна, если понимать ее не как тре- бование найти все, а кактребование разнообразия «верхней» части выдачи, то есть требование найти и показать все варианты, все типы ответов на запрос.
Например, если по запросу «дизайн» поисковик находит только релевантные документы, целиком посвященные дизайну сайтов, то полнота поиска явно низкая. Желательно, чтобы также были найдены страницы про другие виды дизайна — дизайн квартир, ландшафтный дизайн, полиграфический дизайн и пр. Таким образом, если поисковик находит много, но по одной теме, то пользователь получает однообразную информацию.
Надо заметить, что в 2009-2010 годах поисковики стали обращать больше внимания на качество результатов поиска по таким неоднозначным запро- сам. Раньше по большинству «коммерческих» запросов было невозможно получить «некоммерческие» страницы вверху списка результатов поиска — первые десятки и даже сотни результатов поиска относились к коммер- ческой выдаче. Например, по запросу «цветы» вся поисковая выдача была забита страницами с предложениями доставки цветов, причем в основном по Москве. Сегодня ситуация меняется в лучшую для пользователя сторо- ну — поисковая выдача становится более разнообразной.
Точность
Точность — это мера качества выданных результатов. Она вычисляется как коли- чество релевантных страниц в общем объеме того, что выдал нам поисковик.
Если, допустим, по запросу очистители воздуха нам выдано всего 1000 страниц, а на самом деле отношение к очистителям воздуха имеют только 850 из них, то точность поиска будет равна 85%. Ясно, что для поисковика точность важнее всего.
Однако из данного примера видно, что на самом деле нет смысла вычислять точ- ность по всему объему найденных страниц. Гораздо важнее порядок выдачи. А что если все 150 нерелевантных страниц из 1000 окажутся в начале выдачи? Ясно, что средний пользователь, просматривающий две первые страницы результатов поиска (это максимум 20-30 первых результатов), сочтет такую выдачу абсолютно нерелевантной и будет прав.
Таким образом, важно не только обеспечить достаточную точность поиска, то есть релевантность всего объема найденных по запросу страниц, но и правильно распо- ложить релевантные результаты в выдаче, то есть обеспечить правильный порядок, или ранжирование результатов поиска.
Ранжирование
Ранжированием называется упорядочивание результатов поиска по их релевант- ности. Каждая поисковая машина имеет свою «формулу релевантности» для веб- страниц.
В нее входит учет наличия искомых слов на странице, учет плотности этих слов по
отношению к остальным словам, наличие компактных вхождений искомого сло- восочетания, искомых слов в особых текстовых элементах повышенной важности (например, в заголовках) и т. д.
Подробнее об этих факторах ранжирования рассказывается в главах 13 «Внутренние факторы, от которых зависит положение сайта в результатах поиска» и 15 «Автори- тетность сайта и ссылочное ранжирование», а здесь стоит только заметить, что не существует единой формулы релевантности не только для всех поисковиков, но и для одного конкретного поисковика, потому что эта «формула» непрерывно развивается и дополняется разработчиками поисковика. Возможно, в эту самую минуту, когда вы читаете эти строки, разработчик «Рамблера» или «Яндекса» добавляет какой-то совершенно новый фактор ранжирования в алгоритм своей поисковой машины, чтобы в очередной раз кардинально улучшить качество ранжирования...
Кроме упомянутых сведений о составе и релевантности текста на самой странице поисковики анализируют также позицию страницы в общем пространстве Интерне- та, а именно — авторитетность страницы, которую они вычисляют по количеству и качеству ссылок на нее с других сайтов.
Что такое ссылочное ранжирование (PageRank)
Как уже говорилось выше, поисковые машины анализируют структуру ссылок веб- страниц друг на друга. Таким образом выясняется авторитет отдельных страниц (и сайтов в целом) среди сетевого сообщества, среди тех, кто создает сайты и делает на них ссылки на другие сайты.
Сама по себе эта идея не нова — она представляет собой автоматизированный вари- ант довольно старой идеи индекса цитируемости, который используется в научном мире для вычисления авторитета ученого. Идея проста — кого больше цитируют и на кого чаще ссылаются, тот авторитетен, а его работы, очевидно, больше нужны человечеству. Тот же, кого цитируют меньше, человечеству менее интересен.
Поэтому к обычной «текстовой релевантности», основанной на соответствии са- мого текста страницы запросу, можно добавить «авторитетность» страницы среди других страниц.
Впервые эту идею применили в публичной поисковой машине в конце 1990-х го- дов создатели Google — Брин и Пейдж, аспиранты Стэнфордского университета. Для них, конечно, идея научного индекса цитирования была естественной и давно известной.
Именно ссылочный ранг страницы стал основным принципом ранжирования ре- зультатов поиска в Google, что привело к резкому отрыву от конкурентов по каче- ству поиска и стало одной из основных причин доминирования Google в мировом Интернете. Они назвали этот ссылочный ранг PageRank (ранг страницы), включив заодно в название также и фамилию одного из двух авторов идеи — Ларри Пейджа (Larry Page).
Date: 2015-09-25; view: 377; Нарушение авторских прав Понравилась страница? Лайкни для друзей: |
|
|