1. Естественный
отбор в природе
Эволюционная теория утверждает, что каждый
биологический вид целенаправленно развивается и изменяется для того, чтобы
наилучшим образом приспособиться к окружающей среде. В процессе эволюции
многие виды насекомых и рыб приобрели защитную окраску, еж стал неуязвимым
благодаря иглам, человек стал обладателем сложнейшей
нервной системы. Можно сказать, что эволюция - это процесс
оптимизации всех живых организмов. Рассмотрим, какими же средствами
природа решает эту задачу оптимизации.
Основной механизм эволюции
- это естественный отбор. Его суть состоит в том, что более
приспособленные особи имеют больше возможностей для выживания и
размножения и, следовательно, приносят больше потомства, чем плохо
приспособленные особи. При этом благодаря передаче генетической информации (генетическому
наследованию) потомки наследуют от родителей основные их качества.
Таким образом, потомки сильных индивидуумов также будут относительно
хорошо приспособленными, а их доля в общей массе особей будет возрастать.
После смены нескольких десятков или сотен поколений средняя
приспособленность особей данного вида заметно возрастает.
Чтобы
сделать понятными принципы работы генетических алгоритмов, поясним также, как устроены механизмы генетического
наследования в природе. В каждой клетке любого животного содержится вся
генетическая информация этой особи. Эта
информация записана в виде набора очень длинных молекул ДНК (ДезоксирибоНуклеиновая Кислота). Каждая молекула ДНК -
это цепочка, состоящая из молекул нуклеотидов четырех типов,
обозначаемых А, T, C и G. Собственно, информацию
несет порядок следования нуклеотидов в ДНК. Таким образом, генетический
код индивидуума - это просто очень длинная строка символов, где
используются всего 4 буквы. В животной клетке каждая молекула ДНК окружена
оболочкой - такое образование называется хромосомой.
Каждое врожденное качество особи (цвет глаз, наследственные
болезни, тип волос и т.д.) кодируется определенной частью хромосомы,
которая называется геном этого свойства. Например, ген цвета глаз
содержит информацию, кодирующую определенный цвет глаз. Различные значения
гена называются его аллелями.
При размножении животных
происходит слияние двух родительских половых клеток и их
ДНК взаимодействуют, образуя ДНК потомка. Основной способ
взаимодействия - кроссовер (cross-over, скрещивание). При кроссовере ДНК предков делятся на две части, а затем
обмениваются своими половинками.
При наследовании возможны мутации
из-за радиоактивности или других влияний, в результате которых могут
измениться некоторые гены в половых клетках одного из родителей.
Измененные гены передаются потомку и придают ему новые свойства. Если эти
новые свойства полезны, они, скорее всего, сохранятся в данном виде - при
этом произойдет скачкообразное повышение приспособленности вида.
2. Что такое генетический алгоритм
Пусть дана некоторая сложная функция
(целевая функция), зависящая от нескольких переменных, и
требуется найти такие значения переменных, при которых значение функции
максимально. Задачи такого рода называются задачами оптимизации и
встречаются на практике очень часто.
Один из наиболее наглядных
примеров - задача распределения инвестиций, описанная ранее. В этой задаче
переменными являются объемы инвестиций в каждый проект (10 переменных), а
функцией, которую нужно максимизировать - суммарный доход инвестора. Также
даны значения минимального и максимального объема вложения в каждый из
проектов, которые задают область изменения каждой из переменных.
Попытаемся решить эту задачу, применяя известные нам природные
способы оптимизации. Будем рассматривать каждый вариант инвестирования
(набор значений переменных) как индивидуума, а доходность этого варианта -
как приспособленность этого индивидуума. Тогда в процессе эволюции (если
мы сумеем его организовать) приспособленность индивидуумов будет
возрастать, а значит, будут появляться все более и более доходные варианты
инвестирования. Остановив эволюцию в некоторый момент и выбрав самого
лучшего индивидуума, мы получим достаточно хорошее решение задачи.
Генетический алгоритм - это простая модель эволюции в природе,
реализованная в виде компьютерной программы. В нем используются как аналог
механизма генетического наследования, так и аналог естественного отбора.
При этом сохраняется биологическая терминология в упрощенном виде. Вот
как моделируется генетическое наследование
Хромосома |
Вектор (последовательность) из нулей и
единиц. Каждая позиция (бит) называется геном. |
Индивидуум = генетический код |
Набор хромосом = вариант решения задачи.
|
Кроссовер |
Операция, при которой две хромосомы обмениваются
своими частями. |
Мутация |
Cлучайное изменение одной или нескольких
позиций в хромосоме. |
Чтобы
смоделировать эволюционный процесс, сгенерируем вначале случайную
популяцию - несколько индивидуумов со случайным набором хромосом (числовых
векторов). Генетический алгоритм имитирует эволюцию этой популяции как
циклический процесс скрещивания индивидуумов и
смены поколений.
Жизненный
цикл популяции - это несколько случайных скрещиваний (посредством кроссовера) и мутаций, в результате которых к
популяции добавляется какое-то количество новых индивидуумов. Отбор в генетическом алгоритме - это процесс формирования
новой популяции из старой, после чего старая популяция погибает.
После отбора к новой популяции опять применяются операции кроссовера и мутации, затем опять происходит отбор, и
так далее.
Отбор в генетическом алгоритме тесно связан с
принципами естественного отбора в природе следующим образом:
Приспособленность индивидуума |
Значение целевой функции на этом индивидууме.
|
Выживание наиболее приспособленных |
Популяция следующего поколения формируется в
соответствии с целевой функцией. Чем приспособленнее индивидуум, тем больше
вероятность его участия в кроссовере, т.е.
размножении. |
Таким образом, модель отбора
определяет, каким образом следует строить популяцию следующего поколения.
Как правило, вероятность участия индивидуума в скрещивании берется
пропорциональной его приспособленности. Часто используется так называемая
стратегия элитизма, при которой
несколько лучших индивидуумов переходят в следующее поколение без
изменений, не участвуя в кроссовере и отборе. В
любом случае каждое следующее поколение будет в среднем лучше предыдущего.
Когда приспособленность индивидуумов перестает заметно увеличиваться,
процесс останавливают и в качестве решения задачи оптимизации берут
наилучшего из найденных индивидуумов.
Возвращаясь к задаче
оптимального распределения инвестиций, поясним особенности реализации
генетического алгоритма в этом случае.
- Индивидуум
= вариант решения задачи = набор из 10 хромосом Хj
- Хромосома
Хj= объем
вложения в проект j = 16-разрядная запись
этого числа
- Так
как объемы вложений ограничены, не все значения хромосом являются
допустимыми. Это учитывается при генерации популяций.
- Так
как суммарный объем инвестиций фиксирован, то реально варьируются только
9 хромосом, а значение 10-ой определяется по ним однозначно.
Ниже приведены результаты работы генетического
алгоритма для трех различных значений суммарного объема инвестиций K.
Цветными
квадратами на графиках прибылей отмечено, какой объем вложения в данный
проект рекомендован генетическим алгоритмом. Видно, что
при малом значении K инвестируются только те проекты, которые прибыльны
при минимальных вложениях.
Если увеличить суммарный объем
инвестиций, становится прибыльным вкладывать деньги и в более
дорогостоящие проекты.
При дальнейшем увеличении K достигается
порог максимального вложения в прибыльные проекты, и инвестирование в
малоприбыльные проекты опять приобретает смысл.
3. Особенности генетических
алгоритмов
Генетический
алгоритм - новейший, но не единственно возможный способ решения задач
оптимизации. С давних пор известны два основных пути решения таких задач -
переборный и локально-градиентный. У этих методов свои достоинства и
недостатки, и в каждом конкретном случае следует подумать, какой из них
выбрать.
Рассмотрим
достоинства и недостатки стандартных и генетических методов на примере
классической задачи коммивояжера (TSP - travelling salesman problem). Суть задачи состоит в том, чтобы найти
кратчайший замкнутый путь обхода нескольких городов, заданных своими
координатами. Оказывается, что уже для 30 городов поиск оптимального пути
представляет собой сложную задачу, побудившую развитие различных новых методов (в том числе нейросетей и генетических алгоритмов).
Каждый
вариант решения (для 30 городов) - это числовая строка, где на j-ом месте стоит номер j-ого по порядку обхода города.
Таким образом, в этой задаче 30 параметров, причем не все комбинации
значений допустимы. Естественно, первой идеей является полный перебор всех
вариантов обхода. |