Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Перспективы систем текстового поиска





 

Технологии текстового поиска стали одним из важнейших направлений исследований и разработок информационных систем, востребованных практикой. Такие системы применяются буквально во всех сферах деятельности. Как было показано выше, особенно интенсивно они начали развиваться с появлением глобального информационного пространства Web.

 

Изменившиеся условия применения и открывшиеся новые возможности естественным образом выдвинули новые требования к системам текстового поиска. В очень агрегированном виде главные из этих требований можно сформулировать так:

· способность систем текстового поиска эффективно работать с очень большими коллекциями документов;

 

· обеспечение существенно улучшенного отображения смысла документов и пользовательских поисковых запросов;

 

· способность совместно обрабатывать текстовые документы с документами иной природы — статическими изображениями, аудио, видео и др.;

 

· обеспечение эффективных методов поиска не только в статических коллекциях, но и в потоках документов.

 

В последние годы создателями технологий текстового поиска сделано очень многое для того, чтобы используемые системы удовлетворяли этим требованиям. В большой степени перечисленные требования диктуются широко развернувшимися во всем мире разработками в области электронных библиотек.

 

Многими исследовательскими коллективами ведутся разработки разного рода подходов и прототипов инструментария для Web, обеспечивающего эффективную выборку требуемых информационных ресурсов. Характерной чертой осуществляемого в настоящее время этапа развития информационных систем является конвергенция технологий, используемых в различных видах таких систем.Технологии текстовогопоиска, баз данных и Web не только оказывают существенное взаимное влияние, но и совместно используются в проектах информационных систем различного назначения. Техника индексирования текстовых документов послужила в значительной мере прототипом в разработках подходов к решению этой проблемы в системах, оперирующих изображениями, видео и аудио информационными ресурсами.

 

Довольно глубокая интеграция текстовых технологий и технологий баз данных обеспечивается объектно-реляционными серверами баз данных ведущих поставщиков программного обеспечения систем баз данных, хотя на этом пути, как уже отмечалось выше, не использованы все важнейшие достижения технологий текстового поиска. Весьма серьезных последствий для развития систем текстового поиска можно ожидать в связи с успешными интенсивными разработками, направленными на создание технологической платформы Web нового поколения — платформы XML.

 

Как уже говорилось, в среде Web создаются многочисленные поисковые системы, ориентированные на какие-либо сообщества пользователей. Это направление поисковых систем, в которых важное место отводится текстовому поиску, несомненно, будет также активно развиваться.

 

Важно заметить, что системы текстового поиска в Web, основанные на платформе XML, обеспечивают уменьшение гранулярности доступа. Объектами поиска вовсе не обязательно должны быть полные документы. Поисковая система может выдавать по запросам пользователей интересующие их фрагменты документов. Благодаря этому можно существенно повысить эффективность работы пользователей с документами, поддерживаемыми в поисковых системах.

 

Завершая обсуждение перспектив систем текстового поиска, следует назвать актуальные направления исследований и практических разработок в этой области.

 

Вот список тем, которые представляют интерес в перспективе:

· формальные модели, в том числе модели языков;

· стратегии поиска;

 

· машинное обучение в системах информационного поиска; О глубинный анализ текстов;

 

· кластеризация и категоризация текстовых документов; О кросс-языковой поиск; О многоязыковой поиск;

 

· использование машинного перевода в информационном поиске;

· фильтрация документов на основе их содержания;

 

· информационный поиск в Web;

· использование XML и метаданных;

· информационный поиск в электронных библиотеках;

· поиск мультимедийных информационных ресурсов;

· представление и индексирование текстовых документов;

· обработка текстов на естественном языке;

 

· производительность систем текстового поиска, их масштабируемость, архитектура, распределенный поиск;

 

· пользовательские интерфейсы, интерактивный информационный поиск;

· ответы на вопросы;

· оценка систем, построение тестовых коллекций, проведение экспериментов.

Date: 2015-09-27; view: 560; Нарушение авторских прав; Помощь в написании работы --> СЮДА...



mydocx.ru - 2015-2024 year. (0.005 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию