Нейронные сети.

Искусственные нейронные сети (НС) — модель, которая построена но принципу организации и функционирования естественной нейронной сети — сетей нервных клеток живых организмов. Искусственный нейрон представляет собой простейший вариант воплощения естественной нервной клетки. Он может быть реализован математически, программно и аппаратно как простейший переключатель. Понятие искусственного нейрона и искусственной нейронной сети возникло при изучении процессов, протекающих в мозге.

Таким образом, искусственный нейрон в самом первом приближении возможно рассматривать как простейший преобразующий элемент, а за счет различных вариантов соединения нейронов в сеть последняя способна решать множество сложнейших задач. Вообще говоря, нейронная сеть представляет собой систему соединенных и взаимодействующих между собой простых процессоров (искусственных нейронов).

Для того чтобы сеть была способна решить практические задачи, ее необходимо обучить. С математической точки зрения, обучение нейронных сетей — это многопараметрическая задача нелинейной оптимизации.

Нейронные сети не программируются, а обучаются. Возможность обучения — важнейшее достоинство нейронных сетей перед традиционными алгоритмами. Обучение сети состоит в настройке (нахождении, подстройке, корректировке) связей между нейронами, объединенными в сеть и связанными между собой. Эти связи носят название синаптических связей, весов, синаптических весов или просто синапсов.

Обученная сеть способна решать задачи обобщения, кластеризации, прогнозирования, распознавания и др.

Важнейшим свойством нейронных сетей является возможность работы с неполной, неточной, «зашумленной», частично искаженной информацией на входе. В случае успешного обучения сеть сможет вернуть верный результат на основании данных, которые отсутствовали в обучающей выборке.

В результате обучения на примерах строятся математические решающие функции (передаточные функции или функции активации). Эти функции определяют зависимости между входами (X,) и выходными (У,) признаками (сигналами). Модель решающей функции нейрона приведена на рис. 7.1.

Решающая функция — нейрон

Рис. 7.1. Решающая функция — нейрон

Искусственный нейрон состоит из трех основных элементов и выполняет две базовые функции — взвешенное суммирование входов и нелинейное преобразование выхода сумматора.

Функция (см. рис. 7.1), называемая по аналогии с элементарной единицей человеческого мозга нейроном, отображает зависимость значения выходного признака (У) от взвешенной суммы (U) значений входных признаков (X,), в которой вес входного признака (W, — синапс) показывает степень (силу) влияния входного признака на выходной.

Имеются различные передаточные функции нейрона. Самым простым для объяснения вариантом является пороговая функция. Здесь при подаче на вход нейрона напряжения, большего, чем значение «порога», нейрон переключается и «запоминает» состояние. Решающие функции используются в задачах классификации на основе сопоставления их значений при различных комбинациях значений входных признаков с некоторым пороговым значением. Если заданный порог превышен, то считается, что нейрон сработал и, следовательно, распознал некоторый класс ситуаций. Нейронные сети используются и в задачах прогнозирования, когда по значениям входных признаков после их подстановки в выражение решающей функции получается прогнозное значение выходного признака.

Функциональная зависимость может быть линейной, сигмоидальной или иной. Выбор передаточной (активационной) функции нейрона зависит в основном от практической задачи, для решения которой строится нейронная сеть, а также от возможностей реализации (математически, программно, аппаратно). Некоторые варианты функции активации по своим параметрам близки к виду передаточной функции естественного нейрона. Некоторые обладают свойствами симметричности или имеют положительную производную, что бывает удобным для представления и моделирования. Часто используется сигмоидальная форма передаточной (активационной) функции, которая позволяет вычленять более сложные пространства значений выходных признаков. Такая функция называется логистической (рис. 7.2).

Логистическая (сигмоидальная) функция

Рис. 7.2. Логистическая (сигмоидальная) функция

В сети нейроны связаны между собой, когда выход одного нейрона является входом другого. Таким образом, строится нейронная сеть (рис. 7.3), в которой нейроны, находящиеся па одном уровне, образуют слои.

На рис. 7.3 приведена схематическая модель исторически первой нейронной сети — персептрона Розенблатта. Эта сеть содержит три слоя - входной, выходной и «скрытый». В рамках «скрытого» слоя и происходит обработка информации. Он называется «скрытым», так как не виден пользователю. По современной классификации сеть является однослойной, так как считаем только количество «скрытых» слоев.

Нейронная сеть

Рис. 7.3. Нейронная сеть

Обучение нейронной сети, как уже было упомянуто, сводится к определению связей (синапсов) между нейронами и установлению силы этих связей (весовых коэффициентов). В зависимости от варианта выстраивания связей между нейронами можно говорить о различных моделях нейронных сетей. Алгоритмы обучения нейронной сети упрощенно сводятся к определению зависимости весового коэффициента связи двух нейронов от числа примеров, подтверждающих эту зависимость.

Существует распространенный алгоритм обучения нейронной сети. Это алгоритм обратного распространения ошибки. Целевая функция, согласно алгоритму обратного распространения ошибки, должна минимизировать квадрат ошибки в обучении по всем примерам:

где Tj — заданное (идеальное) значение выходного признака (выхода) по /-му примеру; У, — вычисленное (фактическое) значение выхода по /-му примеру.

Сущность алгоритма обратного распространения ошибки сводится к следующему:

  • • произвольно задают небольшие начальные значения весов связей (синаптических весов — W,) нейронов;
  • • вычисляют выход сети (Y) — фактический выход. Это делается для всех обучающих пар «значения входных признаков — значение выходного признака» (вход — идеальный выход), примеров из обучающей выборки;
  • • выполняют рекурсивный алгоритм (шаги 1 и 2), начиная с выходных узлов в направлении к первому скрытому слою, пока не будет достигнут минимальный уровень ошибки.

Достоинство нейронных сетей перед индуктивным выводом заключается в решении не только классифицирующих, но и прогнозных задач. Возможность нелинейного характера функциональной зависимости выходных и входных признаков позволяет строить более точные классификации.

Сам процесс решения задач в силу проведения матричных преобразований осуществляется очень быстро. Фактически имитируется параллельный процесс прохода но нейронной сети, в отличие от последовательного в индуктивных системах. Нейронные сети могут быть реализованы и аппаратно в виде нейрокомпьютеров с ассоциативной памятью.

 
Посмотреть оригинал
< Пред   СОДЕРЖАНИЕ   ОРИГИНАЛ     След >