Меню
Главная
Авторизация/Регистрация
 
Главная arrow Информатика arrow ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ
Посмотреть оригинал

Вопросы и задания

  • 1.Что такое естественный язык? Что такое искусственный язык? Приведите примеры естественных и искусственных языков.
  • 2. Какие виды формальных грамматик вы знаете? Какие примеры формальных и неформальных языков вы можете назвать?
  • 3. В чем заключается сложность формализации естественных языков? Что такое проклятие размерности?
  • 4. Что такое модель описания языка? Что представляет собой модель Bag- of -words? Назовите известные вам достоинства и недостатки этой модели.
  • 5. Какие прикладные задачи обработки естественного языка вы знаете? Какие из них возникли исторически раньше других и стимулировали исследования в области обработки естественного языка?
  • 6. Что такое информационный поиск? Что такое пертинентность? Что такое релевантность? Что такое полнота, точность и F-мера? Что такое ложные пропуски и ложные обнаружения? Почему точность и полнота вычислимы только на тестовых коллекциях?

Практикум

1. Автором этой интересной задачи является Александр Пиперски[1]. В ней речь идет об эволюционных изменениях, происходивших в английском языке. Как вы, вероятно, знаете, в английском языке существуют глаголы, которые называются неправильными (нерегулярными). Их отличие от правильных глаголов состоит в том, что при образовании второй и третьей форм прошедшего времени к инфинитиву не добавляется окончание -ed. Тем, кто учит английский язык как иностранный, приходится заучивать эти глаголы наизусть, поскольку в них трудно обнаружить систему. Однако изначально такая система существовала. Предлагаемая задача демонстрирует одно из множества изменений, которым подверглась эта система.

Задача. Даны (табл. 7.9) глаголы современного английского языка в трех формах (инфинитив, прошедшее время, причастие прошедшего времени). Известно, что в среднеанглийском языке (1-я половина II тыс. н.э.) все эти глаголы имели в причастии прошедшего времени суффикс ~(е)п (например, risen, wonen), но некоторые из них впоследствии его утратили (например, won), а некоторые сохранили (например, risen). Опишите разницу между этими двумя группами глаголов, пользуясь только условием задачи.

Некоторые неправильные глаголы английского языка

Таблица 7.9

Инфинитив

Прошедшее

время

Причастие прошедшего времени

Перевод

Break

Broke

Broken

Ломать

Соте

Came

Come

Приходить

Eat

Ate

Eaten

Есть

Find

Found

Found

Находить

Hang

Hung

Hung

Висеть

Know

Knew

Known

Знать

Rise

Rose

Risen

Подниматься

Shine

Shone

Shone

Сиять

Slink

Slunk

Slunk

Красться

Steal

Stole

Stolen

Красть

Take

Took

Taken

Брать

Win

Won

Won

Побеждать

Подсказка. Выпишите все глаголы в два столбца: в первый столбец запишите те, которые сохранили суффикс -п, во второй — те, которые утратили его. Попробуйте найти закономерность в таком распределении, это и будет ответом на вопрос.

  • 2. Постройте конечный автомат-преобразователь Левенштейна, порождающий все слова, удаленные не более чем на 2 операции от слова «собака».
  • 3. Пользуясь данными из примера про коллаборативную фильтрацию, спрогнозируйте рейтинг, который бы назначил фильму «1 +1» пользователь Игорь.

Рекомендуемая литература

  • 1. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб, пособие/ Е. И. Большакова, Э. С. Клышинский, Д. В. Ландэ [идр.]. — М.: Изд-во МИЭМ, 2011.
  • 2. Богаченко, Н. Ф. Автоматы, грамматики, алгоритмы : учеб, пособие / Н. Ф. Богаченко, Р. Т. Файзуллин. — Омск : «Наследие. Диалог-Сибирь», 2006.
  • 3. Боярский, К. К. Введение в компьютерную лингвистику : учеб, пособие / К. К. Боярский. - СПб.: Изд-во НИУ ИТМО, 2013.

А. Маннинг, К. Введение в информационный поиск / К. Маннинг, П. Рагхаван, X. Шютце. — М.: Вильямс, 2011.

  • [1] Задача приводится по: Пиперски А. Пришел, увидел, победил // Элементы.2014. 29 сентября. URL: http://elemcnty.ru/problcms/908/prishyol_uvidcl_pobcdil
 
Посмотреть оригинал
Если Вы заметили ошибку в тексте выделите слово и нажмите Shift + Enter
< Предыдущая   СОДЕРЖАНИЕ   Следующая >
 

Популярные страницы