Спецкурс
"Введение в информационный поиск"

Основной задачей курса является введение в современное состояние информационного поиска, быстро развивающейся научно-прикладной дисциплины. В курсе дается обзор информационно-поисковых систем, их истории, архитектуры и основных элементов процесса поиска информации (сбор документов, построение индекса и обработка запросов). Рассматриваются как основные модели информационного поиска, так и более глубокие аспекты: лингвистические технологии анализа естественных языков, вопросно-ответные системы и мультимедийный поиск. Приводятся методы оценки качества ИП, рассматриваются поисковые оптимизация и спам, а также методы борьбы с ними.

Спецкурс проходит по средам в 18.30 18.50, аудитория 609 505. Первая лекция 26 сентября.

Экзамен 29 декабря в 16.00, аудитория 371.

Экзамен 15 января в 18.00, аудитория 371.

Программа

1. Введение: исторический обзор и основные понятия информационного поиска.

2. Сбор документов (скачивание). (Клиентская сторона, стркутура Веба, серверная сторона.)

3. Построение индекса.

4. Обработка запросов.

5. Лингвистические технологии в информационном поиске.

6. Математические модели информационного поиска (булева, векторная, ссылочная).

7. Оценка качества информационного поиска.

8. Математические модели информационного поиска (вероятностная, языковая, структурная, обучение ранжированию).

9. Вопросно-ответный и фактографический поиск.

10. Поиск по изображениям.

11. SEO и методы борьбы.

Литература

1. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011.

2. Леонтьева Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия, 2006.

3. Ашманов И., Иванов А. Продвижение сайта в поисковых системах. СПб.: Питер, 2011.

4. http://company.yandex.ru/academic/class2006/.

5. Российский семинар по оценке методов информационного поиска.

6. http://nlp.stanford.edu/IR-book/information-retrieval-book.html.