Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Как работают поисковые системы. Поисковые каталоги. Проблемы, возникающие в процессе поиска информации





1. Индексация -процесс выражения главного предмета или темы текста какого-либо документа в терминах информационно-поискового языка. Как же работают поисковые системы и как они индексируют страницы сайта.

Самая быстрая индексация страниц сайта в Google и это доказанный факт. Ну а самая медленная индексация, соответственно у Яндекса.

2. Сниппет - это отрывок или кусок текста, который находится на странице сайта и выдается поисковиками в поисковой выдаче пользователям интернета ниже названия страницы или тега <title> </title>. Вот как выглядит сниппет в Google и Яндексе.

3. Выдача результатов. Выдача в поисковых системах Яндекс и Google разная.

Каталоги - это такие места, где пользователи могут находить нужные им сайты, точно также как они находят их с помощью поисковых серверов.

Яндекс берет ключевую фразу по каждой странице сайта и распыляет по всем запросам, причем половину слов в этих запросах нет на сайте.

Google дает меньше посетителей на сайт, но результаты более релевантны и соответственно посетители ведут себя на сайте лучше, в плане поведенческих факторов. То есть Google выдает результат более в строгих рамках и все запросы имеют прямое отношение к той информации, которая действительно находится на сайте.

Одна из проблем является чисто методологической. Для проведения эффективного поиска мы заинтересованы в одновременном решении двух противоположных задач:
- увеличение охвата с целью извлечения максимального количества значимой информации;
- уменьшение охвата с целью минимизации шумовой информации.

Другая проблема - многовариантность человеческого языка. Если в английском языке некоторые слова имеют множество различных значений, то русский отличается богатством морфологических вариаций слов, а для полноты поиска необходимо учитывать еще и синонимы.

Еще одна особенность русскоязычной части сети - ее нестабильность. Постоянно изменяются адреса и структура сайтов, они появляются и исчезают, и поисковые машины не успевают обновлять свои базы индексированных данных, поэтому значительная часть списка документов, выданного вам машиной, может оказаться недоступной.

 

Date: 2015-07-17; view: 552; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.005 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию