Основной задачей курса является введение в современное состояние информационного поиска, быстро развивающейся научно-прикладной дисциплины. В курсе дается обзор информационно-поисковых систем, их истории, архитектуры и основных элементов процесса поиска информации (сбор документов, построение индекса и обработка запросов). Рассматриваются как основные модели информационного поиска, так и более глубокие аспекты: лингвистические технологии анализа естественных языков, вопросно-ответные системы и мультимедийный поиск. Приводятся методы оценки качества ИП, рассматриваются поисковые оптимизация и спам, а также методы борьбы с ними.
Спецкурс проходит по пятницам в 18.30, аудитория 605. Первая лекция 30 сентября.
Экзамен 23 декабря в 18.00, аудитория 371.
1. Введение: исторический обзор и основные понятия информационного поиска.
2. Сбор документов (скачивание). (Клиентская сторона, стркутура Веба, серверная сторона.)
3. Построение индекса. (
4. Лингвистические технологии в информационном поиске.
5. Вопросно-ответный и фактографический поиск.
6. Оценка качества информационного поиска.
7. Модели информационного поиска.
8. Обработка запросов.
9. Поиск по изображениям.
10. SEO и методы борьбы.
1. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011.
2. Леонтьева Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия, 2006.
3. Ашманов И., Иванов А. Продвижение сайта в поисковых системах. М.: Вильямс, 2010.
4. http://company.yandex.ru/academic/class2006/.
5. Российский семинар по оценке методов информационного поиска.
6. http://nlp.stanford.edu/IR-book/information-retrieval-book.html.