Главная Случайная страница


Полезное:

Как сделать разговор полезным и приятным Как сделать объемную звезду своими руками Как сделать то, что делать не хочется? Как сделать погремушку Как сделать так чтобы женщины сами знакомились с вами Как сделать идею коммерческой Как сделать хорошую растяжку ног? Как сделать наш разум здоровым? Как сделать, чтобы люди обманывали меньше Вопрос 4. Как сделать так, чтобы вас уважали и ценили? Как сделать лучше себе и другим людям Как сделать свидание интересным?


Категории:

АрхитектураАстрономияБиологияГеографияГеологияИнформатикаИскусствоИсторияКулинарияКультураМаркетингМатематикаМедицинаМенеджментОхрана трудаПравоПроизводствоПсихологияРелигияСоциологияСпортТехникаФизикаФилософияХимияЭкологияЭкономикаЭлектроника






Лабораторная работа № 8





(Глобальные вербальные ИПС: ранжирование выдачи)

1. Используя системы Google, Fast (AlltheWeb), Teoma и WiseNut провести поиск по запросу «Корпусная лингвистика» на английском языке. Логическая формула: (corpus V corpora) & (linguistics V language).

2. Сохранить первую веб-страницу с результатами поиска (10 документов) в каждой системе в своей папке в формате «только html».

3. Составить в файле отчета таблицу с количественными результатами поиска.

4. Проанализировать (попарно) совпадение документов в выдаче по каждой системе (10 документов):

  Google Fast Teoma WiseNut
Google *
Fast число 1 *
Teoma число 2 число 4 *
WiseNut число 3 число 5 число 6 *

где число_i,— количество совпавших документов.

5. Выписать все совпавшие документы по следующей схеме:

– документы, присутствующие в выдаче (в первой десятке) во всех четырех системах;

– документы, присутствующие в выдаче (в первой десятке) в трех системах;

– документы, присутствующие в выдаче (в первой десятке) в двух системах;
при этом каждый документ идентифицировать следующим образом: sN, где s — идентификатор системы (соответственно g, f, t или w), а N — ранг документа в данной системе. Таким образом, для документа, представленного в выдаче в трех системах, в файле отчета будет создана, скажем, такая запись: g3—f9—w2, что означает, что этот документ был найден в системах Google, Fast, и WiseNut и находится в выдаче этих систем соответственно на 3-м, 9-м и 2-м месте.

6. Проанализировать релевантность первых 10 документов и оценить точность каждой системы. Результаты представить в виде таблицы:

№ п/п Название системы Количество релевантных документов Сумма рангов релевантных документов
       

6. Предъявить работу преподавателю.








Date: 2015-07-02; view: 427; Нарушение авторских прав



mydocx.ru - 2015-2024 year. (0.006 sec.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав - Пожаловаться на публикацию