Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Л I __ 1«а am anaf**~ ____ _____





n 3t SM для
PH)№UM 1 - К мая
Подводный мир Нумйбы 347 x 528 - 26k - countnesiuristua.com
Шарм-эль-Шей*.... 700 x 526 - 106k - jpg
шш... »Юх 388.85*. {и
Подводный мир Сафаги Египет 640 x 440-67k-jpg wvww.svah ru
Хургю: подводный ниц 4M к 299 ■ 100k. Jpg свийлеч чмЗйма ewn

VlOOölv |пщшн»мпимр______________________ jl Поиск картинок I [Пек*» Интернет.

Картинки Пошнст:Bc«pajM»pu v

мир. <0^4 сотуи«) обигатегш / 313 x 400* 106k-jpg wwwapus ru


Подводный мир 440 я 649 - 160k www muneum.nj

471 x 399 - 38k - jpg www cht kirn ua
I
Подводный мир / Фота из Южной Кореи 600 x 447- 145k-jpg reports (ЯМ).«!
500 x 375 - 34k - jpg •beut-ew лнш ru
Причудливый ПРДНОДНЫЙ UMр.. 450 к 3«■?9k • jpg Ti"f/Vi l[irwnJ 'U
Подводный мир Индонезии Фотогалерея 464 x 299 32k-jpg www nationaS-gecgijipJuc ru
Подводный мир О ПРОИЗВЕДЕНИИ 432 * 500- 110k -jpg wWw.arttib.ru
Подводный мир 400 x 500 ■ 47k - jpg thefotaw
щ дный «мр Красного моря 300 х 400 • 19k • jpg www tv 0r9.ua

. подводный мир Красного
318 x 300 - 59k -jpg www techno*taitr*vei cum

500x375-47k -jpg www etsroor ГЧ1
3 Ъ Подводный чир 1380 x 819 - 320k-jpg www edelev iu

 

 


G000.00000.p0gIe►

Страниц» рвзупълкее: 1 2 2 й 5 в 7 g 9


 

 


[ Поиск картинок Ц Поиск в Интернете |

Рис. 19.1. Пример результатов поиска по картинкам Google

19.2. Плюсы и минусы «картиночного»
продвижения

Можно перечислить следующие плюсы «картиночного» продвижения.

Веб-страница с иллюстрациями выглядит лучше, нагляднее, чем та, где содержится
только текст. Размещая графику на сайте, мы помогаем посетителям лучше понять
материал, привлекаем внимание к выигрышным аспектам предлагаемых товаров
и услуг, воздействуем на образное мышление пользователей.

Удачная иллюстрация может быть эффективнее страницы текста: чтение требует
времени, а смысл хорошего рисунка воспринимается пользователем за доли секун-
ды. Таким образом, графика на сайте — это явный плюс для него.

Поисковые системы собирают интернет-графику отдельно и предлагают картинки
и ссылки на сайты, где расположены эти картинки, как специальный вид поиска,
то есть «картиночный трафик» является дополнительным к обычному трафику со
страниц результатов поиска. Это второй плюс.

ПОДВОДНЫЙ мир

Посетители из поиска по картинкам бесплатны, это третий плюс.


Обеспечение трафика с помощью графики не является стандартной техникой продви-
жения сайтов, поэтому конкуренция в поиске по картинкам обычно намного меньше,
чем в Большом Поиске, и это уже четвертый плюс в пользу данного способа.

Но есть и несколько минусов «картиночного» продвижения.

□ Поисковые системы не раскрывают информацию о том, какие бывают запросы и
их частоты по изображениям, поэтому владельцу сайта сложно прогнозировать
такой трафик.

□ Часто целью пользователя является только поиск и просмотр нужной картинки.
Найдя нужный рисунок в поисковике, многие либо не переходят на сайт вообще,
либо переходят из любопытства. Мотивация таких посетителей «ослаблена»,
они уже нашли, что хотели. Поэтому качество картиночного трафика ниже,
чем поискового.

□ Наращивание визуального контента (так мы «научно» назвали совокупность
картинок на сайте) достаточно долгое, трудоемкое и дорогое занятие, ведь
каждый рисунок, фотография имеют владельца, обладающего авторскими пра-
вами на изображение. Учет этих прав ведет к затратам. Создание собственной
коллекции изображений — тоже.

О Поисковые роботы индексируют картинки значительно медленнее текстов,
поэтому сложно ожидать быстрых успехов от усилий в данном направлении.
Но в долгосрочной перспективе такая работа, безусловно, окупится.

19.3. Подготовка картинок для
продвижения

Ниже мы приводим несколько технических советов, которые пригодятся веб-ма-
стеру.

Тег IMG и его атрибуты: width и height

Размещение картинки в коде веб-страницы осуществляется с помощью тега IMG.
Разложим его «по полочкам» и попытаемся понять, что может почерпнуть поис-
ковая машина из имеющихся данных.

Обычно тег выглядит так:

<img width="200" height="300" border="0" src="http://www.site,ru/
picturel.jpg" />

Width и height — это длина и ширина изображения. При скачивании рисунка поис-
ковый робот может определить его вес и на основании этих данных даже отличить
черно-белый документ от цветного. Очень часто пользователи используют расши-
ренные возможности поиска — поиск по размеру изображения. Атрибуты тега IMG
«width» и «height» предоставляют поисковику дополнительную информацию о том,
к какому классу причислять изображения (большие, средние, маленькие).

Технологии не стоят на месте, например, в Google есть возможность при поиске по
картинкам задавать такие ограничения, как поиск по лицам и поиск по новостным
изображениям. Перечень возможных ограничений наверняка в дальнейшем будет
постоянно усложняться и пополнится новыми категориями, дающими пользова-
телям возможность более точного поиска.

Альтернативный текст — alt и title

Для случаев, когда по какой-либо причине (например, большой размер изображе-
ния, слабый канал доступа в Сеть, отключенная загрузка изображений в браузере,
недоступный источник картинки) браузер не может отобразить графику на веб-
странице, в теге IMG предусмотрен атрибут al t — альтернативный текст. Выглядит
он следующим образом:

<img alt="4)OTO слона" src="http://www. si te. ru/pi cturel.jpg" />

Если браузер не смог загрузить изображение, на его месте показывается содержимое
атрибута al t, то есть текст. Его также можно увидеть во всплывающей подсказке (ее
еще называют хинт), наведя курсор на изображение. Атрибут служит для удобства
пользователей, в нем можно написать своего рода подпись к изображению. Если
читатель из-за проблем со связью или программой просмотра не увидит саму кар-
тинку, то сможет прочесть, о чем она.

Поисковая система легко извлекает текст из этого атрибута и сопоставляет его с адре-
сом графического файла, то есть в нашем примере покажет картинку picturel. jpg
и ссылку на страницу сайта http://www.site.ru/, где размещено это изображение,
в ответ на поиск картинки с помощью запроса «фото слона».

Естественно, если мы хотим, чтобы картинка появлялась в результатах поиска по
нужным нам запросам, необходимо аккуратно поработать с текстом подписи.

Еще одним комментарием к изображению является атрибут TITLE тега IMG, ко-
торый выглядит так:

<img alt="$OTO слона" title="^OH Джумбо" s rc="http: //www.site, ru/
picturel.jpg" />

Его используют в качестве хинта браузеры семейства Mozilla (Mozilla, Firefox,
Netscape Navigator). Поисковые системы считывают информацию и из этого ат-
рибута, поэтому этот текст нужно «оптимизировать».

Название файла

«Говорящие» названия графических файлов также могут привлечь дополнительных
посетителей на сайт.

Например, в данном случае:

<img alt="(})OTO слона" ti tlе="слон Джумбо" src="http://www.site. ru/buy_
elephant_N.jpg" />
название файла практически указывает, что рисунок является иллюстрацией к
теме «покупки слона Ы». Почему бы поисковой системе не придать такому файлу
больший вес при поиске картинки по запросу «buy elephant»?

Если на сайте много фотографий, то стоит помещать их в папки с «говорящими»
названиями:

<img alt="4>OTO слона" ti С1е="слон Джумбо" src="http://www.site, ru/
elephants/buy_elephant.jpg" />

<img a! t="(j)OTO змеи" title="3Mea нагайна" src="http://www.site. ru/
snakes/buy_snake.jpg" />

<img alt-''фото собаки" titlе="собака Каштанка" src="http://www.site.
ru/doogs/buy_dog.jpg" />

ит. д.

«Говорящие» адреса в адресной строке браузера помогают пользователям сайта
лучше понимать его структуру и легче ориентироваться в предлагаемой инфор-
мации.

Использование статистики запросов

Статистика поисковых запросов показывает, что пользователи ищут изображения
не только с помощью специального поиска в картинках, а начинают поиск фотогра-
фий в стандартной выдаче поисковой машины. Ниже приведены примеры форму-
лировок запросов. Цифры показывают, сколько раз данный запрос осуществлялся
в поиске в течение мая 2007 года по данным «Яндекса» и «Рамблера»:

□ фото девушки — 1691611998;

□ природа фото — 3908 1844;

□ фото стрижек — 3902 1484;

□ кошки фото — 3652 1942;

□ фото животных - 3529 | 1430;
П татуировки фото — 3079 1612;

□ смешные фото — 28211673;

□ фото со спутника — 2600 1781;

□ фото цветы — 2449 11343;

□ фото автомобилей — 2292 11528;

□ фото свадеб- 2184 1321;

□ фотографии детей — 19911592.

Эту особенность поведения пользователей в поиске можно использовать для про-
движения сайта следующим образом.

□ Изучите формулировки поисковых запросов со словами «фото» и «фотографии»
по тематике своего сайта.

□ Найдите и разместите на сайте фотографии, которые можно предложить поль-
зователям в ответ на соответствующие запросы.

□ При просмотре результатов поиска самая заметная деталь описания ссылки на
сайт — титульная фраза, содержимое тега title веб-страницы. Поэтому раз-
местите на странице с фотографиями цитату запроса в ti tl е — <ti tl е>Фото
животных: слоны, кошки, co6aKn</titlе>.

□ Разместите неподалеку от фотографий соответствующие им текстовые опи-
сания. Поисковые системы обращают внимание не только на титул страницы,
но и на текст (тематику) документа. Большую роль играет верстка документа.
Ключевое слово, относящееся к картинке, по возможности должно находиться
в той же ячейке таблицы, что и изображение. Это правило распространяется
и на теги DIV, Р.

□ На ранжирование картинок влияют и имена файлов. Если основным содержа-
нием страницы являются фотографии, стоит использовать «говорящее» назва-
ние — www. canT.ru/buy-elephant-N-photo. html.

□ Ставьте текстовые рекомендации вашего изображения (ссылки) на других ре-
сурсах. Это увеличит шансы картинки на лучшее ранжирование в результатах
поиска.

19.4. Полезные советы

Вот еще несколько общих советов по оптимизации картинок для тех, кто хочет
извлечь коммерческую выгоду из своего визуального контента.

Уникальность

К сожалению, сегодня доля заимствованных материалов в Интернете довольно
велика. Оригинальность позволит вам обойти проблемы с авторскими правами.
Для избежания кражи, копирования и других видов плагиата можно попробовать
нанести на картинку свою торговую марку, логотип или URL сайта.

Оценка целевой аудитории

В настоящее время поисковые алгоритмы индексируют практически весь спектр
графических и текстовых форматов. В поисках визуальной информации пользо-
ватели, как правило, не ограничиваются традиционными форматами jpeg и gif.
Поэтому необходимо заранее продумать, где и в каком формате ваши изображения
будет искать целевая аудитория.

Для книг, инструкций, научной информации предпочтителен формат pdf. Дизай-
неры часто пытаются найти векторное изображение какого-нибудь логотипа и
выбирают в расширенном поиске формат swf. Деловая аудитория, возможно, будет
искать презентации PowerPoint.


Качество и продуманность

Работайте с контрастностью изображений, предлагайте пользователю несколько
вариантов картинок, от больших размеров до маленьких (для предварительного
просмотра). Подготовьте изображения для размещения в Интернете, обеспечьте
быструю загрузку картинок.

Поисковики и пользователи обычно предполагают, что картинка в формате jpg или
png — это непременно фотография, а в формате gif — это что-то другое: логотип,
надпись, рисунок. Не нужно пытаться нарушить эту традицию.

Доступность

Дайте возможность «картиночным» роботам проиндексировать весь ваш визу-
альный контент. Сделайте карту сайта. Старайтесь не использовать для вывода
изображений технологии pop-up и java-script, препятствующие индексации.

В Google есть возможность включить расширенную индексацию картинок. Для
этого нужно зайти в инструменты для веб-мастера, выбрать свой сайт, затем вкладку
«диагностика» и отметить «расширенный поиск картинок».

Маркировка

Наносите на свои изображения дополнительную информацию, это особенно важно
при продажах. Конечному пользователю можно через выдачу поисковика передать
массу полезной информации — цену, скидки, телефон, URL, бренд.

Отсутствие спама

Не пытайтесь оптимизировать неинформативные изображения, такие как меню,
элементы дизайна. В тегах и именах файлов используйте только названия объектов.

Поисковые алгоритмы индексируют только те файлы, которые действительно напо-
минают изображения. Например, для Google адрес pics.php?file=image.jpg означает
php-файл, а не графический jpeg.

Цензура

Внимательно следите за этическими аспектами ваших изображений. На сайте не
должно быть «клубнички», насилия и иных фото, противоречащих политике по-
исковиков. В случае игнорирования этого правила ваш ресурс может попасть под
фильтр, ограничивающий экспозицию подозрительных изображений в выдаче.
Подобная санкция серьезно сократит трафик.

Свежесть

Для поисковиков очень важна актуальность информации. Не случайно, если вы
наберете в поиске по картинкам Google запрос «чемпионат мира», поисковик
выдаст события в картинках в хронологическом порядке. Это правило можно
использовать для своих целей, регулярно обновляя и наращивая визуальный
контент сайта.

География

Глобальные поисковики придают большое значение геотаргетингу. Если вы отпра-
вите запрос «football» в европейских доменах Google, в выдаче поисковика будут
картинки европейского футбола. Но если вы попробуете отправить тот же запрос
в американской зоне, в ответ вам предложат изображения, связанные с американ-
ским футболом.

Вывод — ваш ресурс должен быть привязан к той географической зоне, где нахо-
дится ваша целевая аудитория.

Социальные сети

Поисковые машины доверяют крупным онлайн-фотоальбомам и социальным фо-
торесурсам. В подобных сервисах появляются дополнительные источники ин-
формации об изображении, такие как контекстные теги (подписи, комментарии,
тематические рубрики).

Для продвижения проекта имеет смысл размещать часть своих изображений в таких
сервисах, не забыв о маркировке фотографий и ссылках на свой сайт.

19.5. Выводы

В настоящее время немногие веб-мастера используют возможность продвижения
своих визуальных материалов. Доля «картиночного» трафика в Рунете относи-
тельно невелика. Но, например, на развлекательных некоммерческих сайтах она
увеличивается в разы и доходит до 10-15% от общей аудитории.

Из поиска по картинкам извлекают выгоду продавцы скринсейверов, обоев, иконок,
шаблонов и фотографий. Продвижение с помощью графики активно внедряют
СМ И, отраслевые порталы и интернет-магазины. Не стоит пренебрегать описан-
ными выше возможностями для продвижения своего проекта.

Итак, в этой и предыдущей главах мы рассмотрели возможные нестандартные
методы поискового продвижения сайта. Не следует, однако, путать необычные
и нестандартные методы с «черными», запрещенными методами продвижения.
Существовали, существуют и будут появляться способы воздействия на поиско-
вые системы, которые, несмотря на эффективность, в конечном счете приводят
к негативным последствиям — уничтожению релевантности поисковой выдачи,
ухудшению сайтов и нарушениям работы поисковых систем.

Их применение называется спамом поисковых индексов, или спамдексингом. Нуж-
но знать о существовании этих методов, чтобы понимать, какие именно услуги

предлагает вам оптимизатор и какие риски вы на себя берете. Следующая глава

нашей книги — о спамдексинге, или о запрещенных технологиях.

19.6. Полезные ссылки

□ Попасть на «Яндекс.Картинки» можно, перейдя по адресу http://images.yandex.
ru/. Интерфейс «Яндекса» имеет возможность переключаться между разными
видами поиска, не теряя при этом набранного в поле ввода запроса. Поэтому
если вы набрали запрос, например, «фото Кипр», в основном поиске, то, нажав
ссылку «Картинки» над полем ввода, вы переключитесь на поиск картинок по
тому же запросу «фото Кипр».

О Поиск по картинкам «Рамблера» находится по адресу http://images.rambler.ru/.

□ Поиск картинок Google расположен по адресу http://images.google.ru/.

□ Подборка поисковиков по картинкам (на английском языке) доступна по адресу
http://searchenginez.com/images.html.


Глава 20

Спамдексинг


В этой главе мы расскажем о том, чего не стоит делать для продвижения сайта в
поисковых системах, почему появляются запрещенные приемы продвижения и как
поисковые системы ведут борьбу с ними.

Говоря о продвижении сайта в поисковых системах, невозможно обойти стороной
проблему спамдексинга — очень неоднозначный, спорный вопрос о конфликтных
взаимоотношениях владельцев сайтов и разработчиков поисковых систем. Слово
«спамдексинг» происходитот двух корней — spam и index. Иными словами, этоспам
поисковых индексов, или поисковый спам. Напомним еще раз текст Лицензии на
использование поисковой системы «Яндекса»[25], выделив ключевые моменты.

3.4. Упорядочивание результатов, как часть процесса индексирования и
поиска, происходит полностью автоматически в соответствии с установ-
ленными критериями релевантности, которые могут меняться для повыше-
ния качества по нашему усмотрению.

Ни по каким ключевым словам «Яндекс» не манипулирует позициями сайтов
(страниц), никогда и никому их не продает и не гарантирует их неизмен-
ность.

«Яндекс» понимает релевантность как наилучшее соответствие интересам
пользователей, ищущих информацию, что может в общем случае не сов-
падать с интересами авторов сайтов.

3.5. «Поисковый спам» —это попытки обмана поисковой системы и ма-
нипулирования ее результатами с целью завышения позиции сайтов
(страниц) в результатах поиска. Сайты, содержащие «поисковый спам»,
могут быть понижены при ранжировании или исключены из поиска «Яндекса»
из-за невозможности их корректного ранжирования.

Мы не комментируем удаление сайтов, не предуведомляем о нем и не даем
никаких гарантий и сроков на повторное их включение в поиск.

Мы также не сообщаем исчерпывающий список методов спама, которые
могут вызвать исключение сайта из поиска и/или изменение их позиции...

Естественно, другие поисковые машины также имеют свои правила, при наруше-
нии которых к сайтам применяются санкции вплоть до выбрасывания из индекса,
бана.

Цель поисковой оптимизации тоже заключается в повышении позиций сайтов
(страниц) в результатах поиска, однако хорошо оптимизированные сайты не ис-
ключают из индекса (не банят).

В чем же разница между оптимизацией и спамдексингом? Это довольно сложный
вопрос, разобраться в котором можно, только зная историю спамдексинга с момента
возникновения и до настоящего времени.

История поискового спама идет бок о бок с историей развития поисковых систем.
С момента, когда поисковые системы стали «источником» посетителей, владельцы
сайтов постоянно пытаются решить задачу получения максимального количества
целевых посетителей из результатов поиска при минимальных затратах.

Способ ее решения очевиден — сделать так, чтобы в результатах поиска ссылка на
сайт оказалась в первой десятке поисковой выдачи. Лучше — в первой тройке, еще
лучше — самой первой...

Проблема лишь в том, как этого добиться, не обманывая поисковую систему, то
есть таким образом, чтобы информация, предлагаемая на странице, куда посети-
тель перейдет по ссылке из результатов поиска, наиболее точно соответствовала
его поисковому запросу. Поисковые системы нацелены именно на такой результат,
ведь смысл их работы — показывать пользователям лучшие ответы.

Граница между поисковой оптимизацией и спамом определяется на основании
мнения пользователей, которые ищут информацию. Модераторы поисковиков,
анализируя спорные случаи, стараются представить себя именно на месте пользо-
вателя. Поэтому главный критерий, руководствуясь которым модератор выносит
решение об исключении сайта из индекса, — сделано не для пользователей.

Если на сайте есть элементы текста и кода, о которых можно однозначно сказать,
что они сделаны не для пользователей, — сайт будет выброшен из индекса (заба-
нен). Если требование «для пользователя» выполнено — сайт останется в индексе,
несмотря на наличие приемов продвижения на его страницах.

Перейдем к конкретным примерам, оценивая каждый случай с точки зрения поль-
зователей.

20.1. Возникновение спамдексинга —
спам мета-тегов

Первым приемом поискового спама было заполнение содержимого мета-тегов
cmeta keywords соп1епг="ключевые слова"> словами, не соответствующими
содержимому веб-страницы. Поисковые системы в 1996-1998 годах действовали
по следующему алгоритму:

□ индексировали содержимое тега <meta keywords...;»;

□ искали совпадение ключевых слов запроса со словами, находящимися в этом
теге, и выдавали ссылки на страницы в результатах поиска.

Естественно, текст самих веб-страниц также индексировался и учитывался, но вес
текста в мета-тегах при ранжировании был довольно высоким.

Таким образом, на странице о веб-дизайне можно было «прописать» в теге <meta
keywords...> слово, например «халява», и ссылка на эту страницу появлялась в
результатах поиска по запросу халява. В качестве слов для заполнения спамеры
использовали наиболее популярные поисковые запросы: порно, секс, эротика, ха-
лява, работа, веб-дизайн, вакансии...


Содержимое мета- гегов не видно при просмотре веб-страницы, поэтому пользовате-
ли переходили по ссылкам в результатах поиска и... видели страницы, совершенно
не соответствующие содержанию своих запросов. Пользователь запрашивал «ра-
боту», а в ответ получал ссылки на страницы, описывающие веб-дизайн, халяву,
варез, эротику и т. п.

Технологии поискового спама распространяются очень быстро. За короткое время
мета-теги большинства сайтов оказались заполнены фактически одним и тем же
набором высокочастотных ключевых слов, что привело к закономерному резуль-
тату — полному уничтожению релевантности поисковой выдачи.

Это было первое столкновение интересов владельцев сайтов с интересами разра-
ботчиков поисковых машин. Запретить веб-мастерам использовать не относящиеся
к теме сайта ключевые слова в мета-тегах было невозможно — веб-мастеров слиш-
ком много и поисковикам они не подчиняются, а забанить большинство сайтов —
тоже.

Выход был найден в отказе от использования содержимого мета-тегов для отбора
сайтов поисковой выдачи. Поисковые системы стали учитывать только содержание
текстов веб-страниц, то есть именно ту информацию, которую видят пользователи,
просматривая сайты. Это привело к новому этапу развития поискового спама.

20.2. «Накачка» текстов ключевыми
словами

Новая идея алгоритма отбора и ранжирования в поисковых системах выглядела
примерно так.

□ Индексируется текст документа.

□ Для каждого слова определяется его вес — отношение количества вхождений
слова к общему количеству слов в документе.

□ В выдачу отбираются страницы, в которых содержатся слова поискового за-
проса, ранжирование происходит по убыванию суммы весов ключевых слов.

Эта формула, конечно, условная. Если бы она была справедливой, то документ,
состоящий только из слов запроса, то есть абсолютно неинформативный, получил
бы наилучшее ранжирование. В качестве дополнительных параметров в «формулу
релевантности» входят наличие слов запроса в титуле документа и тегах выде-
ления, заголовках, положение на странице и комментарии к графике (см. главы
об устройстве поисковиков и о внутренних факторах ранжирования). К тому же
вычисляется не абсолютный вес, а плотность нужных ключевых слов на странице
относительно всего текста (при этом поисковики умеют определять, является ли
плотность слов на странице естественной для языка или нет).

«Формулы» ранжирования поисковых систем сложны и закрыты для публики.
Но важен сам факт, что с переходом алгоритмов поисковых систем на учет тексто-
вых факторов документов именно текстовые факторы стали ареной для различ-
ного рода экспериментов по выводу сайтов на верхние строчки поисковой выдачи
(рис. 20.1).

Март, 10, 2007 19:35

видеонаблюдение, системы видеонаблюдения, скрытое видеонаблюдение, цифровое
видеонаблюдение, охранное видеонаблюдение, оборудование видеонаблюдения,
мониторы видеонаблюдения, видеокамеры видеонаблюдение, системы наблюдения,
видео наблюдение, цифровые системы видеонаблюдения, системы безопасности,
системы обеспечения безопасности, комплексная система безопасности, видеокамеры
наблюдения, камеры видеонаблюдения, ик камера, ик видеокамеры, инфракрасная
видеокамера, инфракрасная камера, корпусные видеокамеры, миникамера, модульные
видеокамеры, видеокамеры купольные, купольные камеры, камера ночного видения,
уличные видеокамеры, миниатюрные видеокамеры, микро видеокамеры, микро камера,
поворотные видеокамеры, поворотная камера,!Р камеры ООО Марио.
видеонаблюдение, системы видеонаблюдения, скрытое видеонаблюдение, системы
обеспечения безопасности, комплексная система безопасности, цифровое
видеонаблюдение, охранное видеонаблюдение, оборудование видеонаблюдения,
мониторы видеонаблюдения, видеокамеры видеонаблюдение, системы наблюдения,
видео наблюдение, цифровые системы видеонаблюдения, системы безопасности,
видеокамеры наблюдения, камеры видеонаблюдения, ик камера, ик видеокамеры,
инфракрасная видеокамера, инфракрасная камера, корпусные видеокамеры,
миникамера, модульные видеокамеры, видеокамеры купольные, купольные камеры,
камера ночного видения, уличные видеокамеры, миниатюрные видеокамеры, микро
видеокамеры, микро камера, поворотные видеокамеры, поворотная камера, 1р камеры
видеонаблюдение, системы видеонаблюдения, скрытое видеонаблюдение, цифровое
видеонаблюдение, охранное видеонаблюдение, оборудование видеонаблюдения,
мониторы видеонаблюдения, видеокамеры видеонаблюдение, системы наблюдения,
видео наблюдение, цифровые системы видеонаблюдения, системы безопасности,
системы обеспечения безопасности, комплексная система безопасности, видеокамеры
наблюдения, камеры видеонаблюдения, ик камера, ик видеокамеры, инфракрасная
видеокамера, инфракрасная камера, корпусные видеокамеры, миникамера, модульные
видеокамеры, видеокамеры купольные, купольные камеры, камера ночного видения,
уличные видеокамеры, миниатюрные видеокамеры, микро видеокамеры, микро камера,
поворотные видеокамеры, поворотная камера, |р камеры

Кровельные работы, промышленный альпинизм, высотные работы, остекление
фасадов, ремонт жилых помещений, ремонт офисных помещений, ремонт помещений
стоимость, герметизация швов, герметизация межпанельных швов, ремонт мягкой
кровли, ремонт фасада, мойка стекла, мойка фасадов, очистка фасадов, фасадные
работы, расценки ровельных работ, кровельные работы стоимость, монтаж наружной
рекламы, очистка крыши снег, очистка крыш от снега, кондиционеры монтаж москва
ООО мариовид. Кровельные работы, промышленный альпинизм, высотные работы,
остекление фасадов, ремонт жилых помещений, ремонт офисных помещений, ремонт
помещений стоимость, герметизация швов, герметизация межпанельных швов, ремонт
мягкой кровли, ремонт фасада, мойка стекла, мойка фасадов, очистка фасадов,
фасадные работы, расценки кровельных работ, кровельные работы стоимость, монтаж
наружной рекламы, очистка крыши снег, очистка крыш от снега, кондиционеры
монтаж Москва Кровельные работы, промышленный альпинизм, высотные работы,
остекление фасадов, ремонт жилых помещений, ремонт офисных помещений, ремонт
помещений стоимость герметизация швов, герметизация межпанельных швов, ремонт
мягкой кровли, ремонт фасада, мойка стекла, мойка фасадов, очистка фасадов,
фасадные работы, расценки кровельных работ, кровельные работы стоимость, монтаж
наружной рекламы, очистка крыши снег, очистка крыш от снега, кондиционеры
монтаж москва

Рис. 20.1. Пример страницы с текстом, «накачанным» ключевыми словами

Основной прием, который до сих пор используют как спамеры, так и специалисты
по продвижению, — «накачка» текстов необходимыми ключевыми словами. Иначе
говоря, искусственное увеличение весов ключевых слов, проводимое для улучшения
ранжирования в поисковых системах.

Потребность варьировать веса слов на странице, которую видят пользователи,
привела к появлению ряда технических приемов по накачке.

20.3. Скрытый и мелкий текст

Если белыми буквами заверстать текст на странице с белым фоном (или желтыми на
желтом и т. п.), пользователи в своих браузерах не увидят, что написано на странице.
Но поисковые роботы этот скрытый текст увидят, проиндексируют его и будут счи-
тать частью содержимого документа. Соответственно и ранжировать этот документ
поисковая машина будет с учетом невидимого для пользователей текста.

В скрытом тексте легко разместить любое количество ключевых слов для завыше-
ния их веса на странице. Этот прием спамдексинга так и называется — скрытый
текст.

Вариантом этого же способа является мелкий текст, когда нужные для «накачки»
слова набирают очень мелким шрифтом. Внешне такой текст на веб-странице может
выглядеть просто как линия, настолько в нем неразличимы отдельные буквы.

Естественно, как только эти приемы стали применяться массово, поисковые сис-
темы их заметили и начали с ними бороться.

В настоящее время использование скрытого и мелкого текста очень быстро приводит
к исключению сайта из индекса поисковых систем. Понятно, что информацию, ко-
торую пользователи попросту не могут увидеть, невозможно назвать информацией
«для пользователей». Правда, распознается такой текст не совсем автоматически.
Попытки поисковых систем научиться автоматически определять наличие скрытого
и мелкого текста на индексируемых страницах, не привели к надежному решению.

Поисковые роботы пока не читают и не разбирают стилевую разметку (это сложно и
очень дорого по ресурсам), а с помощью каскадных таблиц стилей (CSS) несложно
придать тексту любой размер и цвет. Поэтому основным источником информации о
спамерских приемах для поисковых систем являются веб-мастера конкурирующих
сайтов. Они сообщают модераторам об использовании запрещенных приемов и
таким образом избавляются от ссылок на сайты конкурентов в поисковой выдаче.

20.4. Перенаправление посетителей —
ре д и рею-

текст, «накачанный» ключевыми словами, становится нечитаемым, поэтому, даже
перейдя на такую страницу из результатов поиска, посетители вряд ли на ней за-
держатся.

Но целью поискового спамера является не сама позиция ссылки на страницу с
неестественными текстами в результатах поиска, а показ посетителю своей стра-
ницы, где понятно, грамотно и хорошим стилем изложено какое-то коммерческое
предложение или показана контекстная реклама.


Для решения такой задачи была предложена идея, реализация которой стала на-
стоящим бичом поисковых систем. Ее смысл заключается в использовании для
продвижения не одной, а двух страниц. Первая страница должна занять нужное
место в поисковой выдаче и быть входной для пользователей, переходящих с по-
исковой системы, а вторая использоваться для отображения нужной информа-
ции посетителям. А посетителя надо просто автоматически перебросить с первой
страницы на вторую.

Специальная страница для поисковых систем так и называется — входная страница,
или дорвей (от англ. doorway — вход).

Перенаправление (редирект) посетителя в браузере с дорвея на целевую страни-
цу обычно выполняется принудительно, поэтому содержимое входной страницы
пользователь не успевает увидеть. Здесь снова налицо создание контента не для
пользователей, поэтому страницы, откуда посетитель не по своей воле перебра-
сывается на страницу с иным содержанием, должны быть исключены из индекса
поисковой системы.

Поисковые машины стараются обнаружитьтакиестраницы с редиректом и забанить
их. Однако некоторые способы редиректа по техническим причинам не определя-
ются поисковыми роботами автоматически, поэтому применяется тот же метод
борьбы с дорвеями — жалобы конкурентов в поисковую систему.

Размещение на сайте дорвейных страниц может привести к бану всего сайта, по-
этому спамеры размещают целевые и входные страницы на разных сайтах и даже в
разных доменах. Если при переходе из поисковой системы по ссылке вы оказались
на сайте, домен которого отличается от указанного в результатах поиска, скорее
всего вы попали именно на дорвей с редиректом.

20.5. Входные страницы
с ручным переходом

Репрессии, применяемые к сайтам за автоматическое перенаправление с дорвея на
целевую страницу, привели к появлению нового приема. Спамеры отказались от
принудительного редиректа посетителей, изменив внешний вид входных страниц.
На дорвеях нового типа крупными буквами в половину экрана красовалось пригла-
шение — «Вход» (рис. 20.2). Собственно, выбор посетителя дорвея был небольшим:
или закрыть страницу, или все же попробовать зайти на сайт в надежде, что там
окажется необходимая информация. Входили — многие.

Казалось бы, все без обмана. Содержимое входной страницы пользователь может
увидеть, («накачанный» текст располагался намного ниже приглашения войти, для
его просмотра необходимо было воспользоваться прокруткой, но всем и так ясно,
что вся нужная информация есть на первом экране), скрытого и мелкого текста
нет, принудительного перенаправления тоже. Но изготовители «ручных» дорвеев
стали стремительно развивать идею в следующем направлении.


Самая ценная халява Инета!!! шшш

УТ»|0П

Мы проверило более 1000 ссылок в выбрала самую ценную н 100% высылаемую в Россию в страны СНГ халяву!
Вам осталось только взять!!!

ВХОД

Халяиа туп

Рис. 20.2. Пример дорвея без принудительного перенаправления пользователя
на другой сайт, но с крупной надписью «Вход»

В работе по продвижению сайтов есть две объективные сложности. Во-первых,
поисковые системы не раскрывают алгоритмы ранжирования и постоянно вносят
в них корректировки. Что делать владельцу сайта, если его страница в результате
изменений в алгоритме, о которых он не знает, опустилась в результатах поиска?
Вспомним для примера текст Лицензии «Яндекса».

«Яндекс» понимает релевантность как наилучшее соответствие интересам
пользователей, ищущих информацию, что может в общем случае не совпа-
дать с интересами авторов сайтов.

Во-вторых, чаще всего технически невозможно продвигать одну страницу по боль-
шому количеству поисковых запросов, ведь один и тот же запрос пользователи мо-
гут задавать по-разному. Мы уже приводили пример, сколько вариантов написания
слова «Фольксваген» встречается в поисковых запросах. Аналогичная картина и с
«Мерседесами», «Тойотой» и т. п. Велико количество запросов, где слово написано
с опечаткой, ошибкой либо в ином регистре. Кроме того, существует множество
смысловых синонимов (разные запросы, означающие одно и то же), например туры
в Египет, отдых в Египте, путевка в Египет. Если попытаться в одном тексте употребить
все возможные варианты запросов, результат будет по меньшей мере выглядеть
странно.

Идея использования дорвеев решала обе названные проблемы. Так как текст вход-
ной страницы не предназначался для пользователей, можно было создать для ка-
кого-то запроса не один дорвей, а десять, сто, тысячу, в которых нужные ключевые
слова сочетались бы в различных тегах и весовых вариантах. После индексации
этой группы входных страниц, какую бы комбинацию параметров ни устанавливала
поисковая система для обеспечения наилучшего ранжирования, всегда находился
дорвей, где комбинация этих параметров была близкой к идеалу. Соответственно,
ссылка на дорвей появлялась в первой десятке результатов поиска.

Для продвижения по многим запросам можно было для каждого запроса сформи-
ровать отдельную группу дорвеев, что и делалось. Входные страницы создавались
специальными программами-генераторами, и «производство» нескольких тысяч
страниц не занимало много времени.

В результате эпидемии дорвеев поисковые системы оказались в очень сложной си-
туации. На одну страницу, предназначенную для пользователей, в индекс пролезали
сотни и тысячи страниц, предназначенных только для поисковых роботов. Дея-
тельность «дорвеестроителей» привела к тому, что поисковые системы вынуждены
были ранжировать огромную гору мусора. Исправить ситуацию удалось благодаря
следующему шагу в развитии поисковых технологий - учету внешних ссылок для
расчета ранжирования (подробнее об этом см. в главе об управлении ссылками).

Использование входных страниц одно время считалось технологией не спама поис-
ковых систем, а методом продвижения сайтов. И споры о значении дорвеев еще не
утихли. Например, прием с созданием на сайте нескольких страниц, «заточенных»
под разные варианты одного запроса, применяется и сегодня.

Но к запрещенным методам однозначно отнесено создание входных страниц, не
несущих полезной информации для пользователя и неряшливо оформленных. За
размещение на сайте даже одной такой страницы из индекса может быть исключен
весь сайт.

20.6. Спам тегов <noframes>,
или бридж-страницы

Оригинальное «хранилище» для текстов, предназначенных лишь поисковому ро-
боту, было найдено при переходе рынка на новые версии браузеров.

В то время среди веб-мастеров стал популярным прием создания страниц на сайте с
помощью тега <f гате> (в переводе с англ. — рама, каркас; произносится как «фрейм»).
С помощью этого приема можно было как бы разделить всю отображаемую страницу
на несколько площадей (фреймов) и показывать в каждой из них разный текст.

Новые браузеры, прекрасно отображающие фреймы, сосуществовали вместе со
старыми версиями, которые не поддерживали фреймы. Поэтому в язык HTML был
введен специальный тег, <nof rames>, содержимое которого должно было отобра-
жаться в случае, если пользователь открывает страницу в устаревшем браузере, не
поддерживающем фреймы.

Поисковые системы прекрасно индексировали тексты, находящиеся в теге
<nof rames>, поэтому на какое-то время сложилась парадоксальная ситуация. По-
скольку практически у всех пользователей были уже новые браузеры и никаких
проблем с просмотром фреймовых сайтов не возникало, можно было легко сложить
специальный, «накачанный» текст для поисковых роботов в тег <nof rames>, а во
фрейме показать пользователям нужную информацию, тем самым увеличив реле-
вантность страницы по запросу и обманув поисковик.

Подобные страницы получили название бридж-страниц (от англ. bridge - мост),
или информационных страниц. Время бридж-страниц закончилось, когда поис-
ковые системы перестали учитывать содержимое тега <nof rames> как контент
страницы, — необходимость в этом теге отпала, так как все версии браузеров стали
правильно отображать фреймы.

20.7. Замена содержимого входных
страниц, или свопинг

Показать поисковому роботу одно содержимое, а пользователям другое можно
также с помощью простого приема — замены, или свопинга (англ. swap — обмен,
замена; читается «своп»), содержимого страницы после ее посещения поисковым
роботом.

Своп выполняется обычно следующим образом,

□ С помощью генератора входных страниц создается большое количество дорвеев.

□ Дорвейный сайт выкладывается в Интернете и подается на индексацию в по-
исковые системы.

□ После визита на страницы поискового робота содержимое заменяется тем, ко-
торое необходимо показывать посетителям.

Смысл приема заключается в том, что при замене содержимого после индексации
в индексе поисковой системы остается «накачанное» ключевыми словами содер-
жимое, а пользователям предоставляется нужная спамеру информация. При этом
невозможно обвинить спамера в использовании редиректа или создании страниц,
не содержащих информации для пользователей и/или неряшливо оформленных.
Владелец сайта имеет право изменять информацию, когда ему это необходимо,
а разница между информацией в индексе и реальной выдачей получилась как бы
естественным путем, поэтому нет повода для бана такого сайта.

Метод работает до следующего визита на страницу поискового робота, после чего
информация о содержимом обновляется уже и в индексе поисковой системы. Сто-
ит заметить, что срок между двумя заходами поискового робота на одну и ту же
страницу может составлять несколько недель или месяцев.

Поскольку своп, как статическая замена текста страницы, работает только до сле-
дующего захода поискового робота, а затем страницу можно выбросить, был при-
думан метод динамической замены страницы - клоакинг.

20.8. Клоакинг

Термин «клоакинг» (cloaking) происходит от английского глагола «to cloak» —
маскировать, прикрывать, прятать, скрывать.

Клоакинг — это методика отображения роботу поисковой системы оптимизиро-
ванной страницы вместо той страницы, которую увидит обычный пользователь
при просмотре сайта. Иногда эти «технические» страницы делают не просто опти-
мизированными, а в корне отличными от оригинальных. Например, поисковому
роботу выдают страницу со списком популярных музыкальных композиций с
расширением МРЗ, в то время как обычному пользователю предлагают посетить
магазин музыкальных компакт-дисков. Таким методом в интернет-магазины ком-
пакт-дисков заманивают пользователей, которые искали в поисковой системе
ссылки на свежие хиты в формате МРЗ.

Клоакинг реализуется с помощью программ и скриптов, выполняющихся на стороне
веб-сервера. Серверные скрипты формируют выходные данные в зависимости от
изменяющихся параметров: параметры в адресе запроса, системные переменные веб-
сервера, некоторые параметры запроса. По ряду данных (например, по IP-адресу или
значению переменной User-agent) можно на стороне веб-сервера определить, от кого
исходит запрос на получение веб-страницы — от робота или обычного пользовате-
ля—и сформировать для каждого из них отдельную страницу. Выполнить клоакинг
с помощью обычного HTML или средств JavaScript прямо в браузере пользователя
не получится, тем более что робот поисковика браузером не пользуется.

На первый взгляд может показаться, что клоакинг нельзя «отловить», поскольку
надо быть пользователем, чтобы увидеть обычную страницу, и роботом — чтобы
увидеть оптимизированную версию страницы. Тем не менее существует возмож-
ность определить наличие клоакинга, не являясь при этом сотрудником поисковой
системы, и ниже мы расскажем о ней.

Как же определить робота поисковой системы? Есть две возможности:

□ проверить поле User-agent;

□ проверить IP-адрес, откуда приходит запрос.

Клоакинг по User-agent

User-agent (в переводе с англ. «пользовательский агент») — это одно из служебных
полей, которое передается серверу от браузера или другой программы вместе с
запросом на получение страницы. Если это человек, просматривающий сайт, то
его User-agent — это идентификатор его браузера, соответственно в поле User-agent
будет отображаться название и версия браузера. Если это поисковый робот, то поле
User-agent будет содержать название или идентификатор поисковика (который
задали разработчики поисковика).

Метод клоакинга по User-agent — это самый простой метод, основанный на проверке
данных в поле User-agent, где при запросе в большинстве случаев передается имя
робота и некоторые дополнительные данные.

Вот примеры данных в User-agent для некоторых поисковых роботов:

□ Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html);

□ Yandex/1.01.001 (compatible; Winl6; I);


□ Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/
slurp).

У скрипта, выполняющего подмену «пользовательского содержания» на текст
для роботов, есть словарь таких значений параметра. Чаще всего для распозна-
вания поисковых роботов используется словарь подстрок (частей записи). Если
искомая подстрока есть в поле User-agerit программы, запрашивающей страницу,
то скрипт выдает оптимизированную страницу. Скрипт может выдавать всем
поисковым роботам один и тот же текст, а может выдавать каждому роботу свою
страницу, оптимизированную специально для него. Подробнее строка User-agent
для разных поисковых роботов описана в Приложении I «Роботы поисковых
систем».

Такой клоакинг довольно просто «отловить». Для этого достаточно, чтобы раз-
работчики поисковика или пользователи с помощью специальных программ или
расширений к браузерам представились при запросе страницы роботом, то есть
следует поместить в поле User-agent название поискового робота. В итоге на экране
вместо обычной страницы загрузится «оптимизированная» страница, потому что
скрипт на сайте примет пользователя за робота.

Разработчики поисковых систем давно уже создали особые автоматические средства
для обнаружения клоакинга. Это серверы, на которых специальный поисковый
робот изображает из себя пользователя, используя браузер для запроса страниц,
и затем сравнивает полученные страницы с теми, которые получил с сайта «обыч-
ный» поисковый робот.

Понятно, что поисковые машины при обнаружении на сайте клоакинга с высокой
вероятностью выбросят такой сайт из индекса, поскольку клоакинг прямо проти-
воречит правилам поисковых систем.

Клоакинг по IP-адресу

Есть и более хитроумный способ подмены содержания, основанный на проверке
IP-адреса, откуда приходит запрос.

Как известно, архитектура Интернета такова, что IP-адрес практически невозможно
подделать. Зная корпоративные подсети (диапазоны адресов) поисковых систем,
можно выдавать оптимизированные страницы вообще всем веб-клиентам из ука-
занных подсетей. В этом случае даже сотрудник поисковой системы с обычным
браузером увидит тот же список МРЗ-файлов, что и робот, а не рекламу магазина
компакт-дисков, как все остальные.

Но даже в этом случае определить наличие клоакинга относительно просто. Со-
труднику поисковой системы достаточно запросить страницу через прокси-сервер
(промежуточный сервер, являющийся посредником между браузером и сайтом) из
другого диапазона адресов. Например, можно воспользоваться анонимным прокси,
расположенным где-нибудь в Новой Зеландии, или воспользоваться сервисом
анонимизации, аналогичным WebWarper.net.

Обычному пользователю, чтобы определить наличие клоакинга на сайте, достаточно
просмотреть сохраненную копию страницы в базе поисковой системы (в боль-
шинстве поисковых систем есть такая возможность). Если сохраненная страница
в базе поисковой системы отличается от той, которую можно увидеть на сайте, то
скорее всего на сайте используется клоакинг. Следует только обращать внимание
на даты изменения страницы и ее индексации, поскольку можно спутать клоакинг
с описанным выше свопингом.

Date: 2015-09-25; view: 370; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.008 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию