Бакалавр
Дипломные и курсовые на заказ

Перевод. 
Основные принципы построения информационно-поисковых систем

РефератПомощь в написанииУзнать стоимостьмоей работы

Уже давно осталась позади романтика создания ИПЯ, как естественного языка. Если даже пользователю предлагается вводить запросы на естественном языке, то это не значит, что система будет осуществлять семантический разбор запроса пользователя. Проза жизни заключается в том, что обычно фраза разбивается на слова, из этого списка удаляются запрещенные и общие слова, иногда производится нормализация… Читать ещё >

Перевод. Основные принципы построения информационно-поисковых систем (реферат, курсовая, диплом, контрольная)

Уже давно осталась позади романтика создания ИПЯ, как естественного языка. Если даже пользователю предлагается вводить запросы на естественном языке, то это не значит, что система будет осуществлять семантический разбор запроса пользователя. Проза жизни заключается в том, что обычно фраза разбивается на слова, из этого списка удаляются запрещенные и общие слова, иногда производится нормализация лексики, а затем все слова связываются либо логическим AND, либо OR. Таким образом запрос типа:

>Software that is used on Unix Platform.

будет преобразован в:

>Unix AND Platform AND Software.

что будет означать примерно следующее: «Найди все документы, в которых слова Unix, Platform и Software встречаются одновременно» .

Возможны и варианты. Так в большинстве систем фраза «Unix Platform» будет опознана как ключевая фраза, и не будет разделяться на отдельные слова. Вообще говоря, и все три слова могут быть опознаны как одна ключевая фраза. Другой подход заключается в вычислении близости между запросом и документом. В этом случае, в соответствии с векторной моделью представления документов и запросов вычисляется мера близости. К настоящему времени известно около дюжины различных мер близости. Наиболее часто применяется cos угла между поисковым образом документа и запросом пользователя. Именно эти проценты соответствия документа запросу и выдаются в качестве справочной информации при списке найденных документов.

Наиболее продвинутым языком запросов является следующий: кроме обычного набора AND, OR, NOT, эта система позволяет использовать еще и NEAR. Последний оператор позволяет организовать контекстный поиск. Все документы в системе разбиты на поля, поэтому в запросе можно указать в какой части документа пользователь хочет увидеть ключевое слово (в ссылке, заголовке и т. п.). Можно также задать поле ранжирования выдачи и критерий близости документов запросу.

Показать весь текст
Заполнить форму текущей работой