Основной задачей курса является введение в современное состояние информационного поиска, быстро развивающейся научно-прикладной дисциплины. В курсе дается обзор информационно-поисковых систем, их истории, архитектуры и основных элементов процесса поиска информации (сбор документов, построение индекса и обработка запросов). Рассматриваются как основные модели информационного поиска, так и более глубокие аспекты: лингвистические технологии анализа естественных языков, вопросно-ответные системы и мультимедийный поиск. Приводятся методы оценки качества ИП, рассматриваются поисковые оптимизация и спам, а также методы борьбы с ними.
Спецкурс проходит по средам в 18.30 18.50, аудитория 609 505. Первая лекция 26 сентября.
Экзамен 29 декабря в 16.00, аудитория 371.
Экзамен 15 января в 18.00, аудитория 371.
1. Введение: исторический обзор и основные понятия информационного поиска.
2. Сбор документов (скачивание). (Клиентская сторона, стркутура Веба, серверная сторона.)
3. Построение индекса.
4. Обработка запросов.
5. Лингвистические технологии в информационном поиске.
6. Математические модели информационного поиска (булева, векторная, ссылочная).
7. Оценка качества информационного поиска.
8. Математические модели информационного поиска (вероятностная, языковая, структурная, обучение ранжированию).
9. Вопросно-ответный и фактографический поиск.
10. Поиск по изображениям.
11. SEO и методы борьбы.
1. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011.
2. Леонтьева Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия, 2006.
3. Ашманов И., Иванов А. Продвижение сайта в поисковых системах. СПб.: Питер, 2011.
4. http://company.yandex.ru/academic/class2006/.
5. Российский семинар по оценке методов информационного поиска.
6. http://nlp.stanford.edu/IR-book/information-retrieval-book.html.