Основной задачей курса является введение в современное состояние информационного поиска, быстро развивающейся научно-прикладной дисциплины. В курсе дается обзор информационно-поисковых систем, их истории, архитектуры и основных элементов процесса поиска информации (сбор документов, построение индекса и обработка запросов). Рассматриваются как основные модели информационного поиска, так и более глубокие аспекты: лингвистические технологии анализа естественных языков, вопросно-ответные системы и мультимедийный поиск. Приводятся методы оценки качества ИП, рассматриваются поисковые оптимизация и спам, а также методы борьбы с ними.
Спецкурс проходит по средам в 20.00, аудитория 523. Первая лекция 13 октября.
Дополнительная лекция 22 декабря в 20.00, аудитория 523.
Экзамен 25 декабря в 14.00 (по предварительной записи) и в 16.00 (для остальных), аудитория 510.
Экзамен 17 и 19 января в 17.30 в аудитории 371 (не более 15 человек в каждый из дней). Для участия необходимо предварительно записаться по электронной почте leozub@cs.msu.su.
1. Введение: исторический обзор и основные понятия информационного поиска.
2. Сбор документов.
3. Построение индекса.
4. Обработка запросов.
5. Лингвистические технологии в информационном поиске.
6. Модели информационного поиска.
7. Вопросно-ответный поиск.
8. Поиск по изображениям.
9. Оценка качества информационного поиска.
10. SEO и методы борьбы.
1. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011.
2. Леонтьева Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия, 2006.
3. Ашманов И., Иванов А. Продвижение сайта в поисковых системах. М.: Вильямс, 2010.
4. http://company.yandex.ru/academic/class2006/.
5. Российский семинар по оценке методов информационного поиска.
6. http://nlp.stanford.edu/IR-book/information-retrieval-book.html.