Спецкурс
"Введение в информационный поиск"

Основной задачей курса является введение в современное состояние информационного поиска, быстро развивающейся научно-прикладной дисциплины. В курсе дается обзор информационно-поисковых систем, их истории, архитектуры и основных элементов процесса поиска информации (сбор документов, построение индекса и обработка запросов). Рассматриваются как основные модели информационного поиска, так и более глубокие аспекты: лингвистические технологии анализа естественных языков, вопросно-ответные системы и мультимедийный поиск. Приводятся методы оценки качества ИП, рассматриваются поисковые оптимизация и спам, а также методы борьбы с ними.

Спецкурс проходит по пятницам в 18.30, аудитория 605. Первая лекция 30 сентября.

Экзамен 23 декабря в 18.00, аудитория 371.

Программа

1. Введение: исторический обзор и основные понятия информационного поиска.

2. Сбор документов (скачивание). (Клиентская сторона, стркутура Веба, серверная сторона.)

3. Построение индекса. (

4. Лингвистические технологии в информационном поиске.

5. Вопросно-ответный и фактографический поиск.

6. Оценка качества информационного поиска.

7. Модели информационного поиска.

8. Обработка запросов.

9. Поиск по изображениям.

10. SEO и методы борьбы.

Литература

1. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск. М.: Вильямс, 2011.

2. Леонтьева Н. Н. Автоматическое понимание текстов: системы, модели, ресурсы. М.: Академия, 2006.

3. Ашманов И., Иванов А. Продвижение сайта в поисковых системах. М.: Вильямс, 2010.

4. http://company.yandex.ru/academic/class2006/.

5. Российский семинар по оценке методов информационного поиска.

6. http://nlp.stanford.edu/IR-book/information-retrieval-book.html.