Перевод Кантор И Решение Диофантова уравнения

Статья Пример ГА: Решение Диофантова уравнения. И ее продолжение Решение Диофантова уравнения - разбор исходников. Перевод Кантор И.

Перевод Кантор И.

Диофантово уравнение
C++ код
CDiophantine

Рассмотрим диофантово (только целые решения) уравнение: a+2b+3c+4d=30, где a, b, c и d - некоторые положительные целые. Применение ГА за очень короткое время находит искомое решение (a, b, c, d).

Конечно, Вы можете спросить: почему бы не использовать метод грубой силы: просто не подставить все возможные значения a, b, c, d (очевидно, 1 <= a,b,c,d <= 30) ?

Архитектура ГА-систем позволяет найти решение быстрее за счет более 'осмысленного' перебора. Мы не перебираем все подряд, но приближаемся от случайно выбранных решений к лучшим.

Для начала выберем 5 случайных решений: 1 =< a,b,c,d =< 30. Вообще говоря, мы можем использовать меньшее ограничение для b,c,d, но для упрощения пусть будет 30.

Хромосома	(a,b,c,d)
1	(1,28,15,3)
2	(14,9,2,4)
3	(13,5,7,3)
4	(23,8,16,19)
5	(9,13,5,2)

Таблица 1: 1-е поколение хромосом и их содержимое
Чтобы вычислить коэффициенты выживаемости (fitness), подставим каждое решение в выражение a+2b+3c+4d. Расстояние от полученного значения до 30 и будет нужным значением.

Хромосома	Коэффициент выживаемости
1	\|114-30\|=84
2	\|54-30\|=24
3	\|56-30\|=26
4	\|163-30\|=133
5	\|58-30\|=28

Таблица 2: Коэффициенты выживаемости первого поколения хромосом (набора решений)
Так как меньшие значения ближе к 30, то они более желательны. В нашем случае большие численные значения коэффициентов выживаемости подходят, увы, меньше. Чтобы создать систему, где хромосомы с более подходящими значениями имеют большие шансы оказаться родителями, мы должны вычислить, с какой вероятностью (в %) может быть выбрана каждая. Одно решение заключается в том, чтобы взять сумму обратных значений коэффициентов, и исходя из этого вычислять проценты. (Заметим, что все решения были сгенерированы Генератором Случайных Чисел - ГСЧ)

Хромосома	Подходящесть
1	(1/84)/0.135266 = 8.80%
2	(1/24)/0.135266 = 30.8%
3	(1/26)/0.135266 = 28.4%
4	(1/133)/0.135266 = 5.56%
5	(1/28)/0.135266 = 26.4%

Таблица 3: Вероятность оказаться родителем
Для выбора 5-и пар родителей (каждая из которых будет иметь 1 потомка, всего - 5 новых решений), представим, что у нас есть 10000-стонняя игральная кость, на 880 сторонах отмечена хромосома 1, на 3080 - хромосома 2, на 2640 сторонах - хромосома 3, на 556 - хромосома 4 и на 2640 сторонах отмечена хромосома 5. Чтобы выбрать первую пару кидаем кость два раза и выбираем выпавшие хромосомы. Таким же образом выбирая остальных, получаем:

Хромосома отца	Хромосома матери
3	1
5	2
3	5
2	5
5	3

Таблица 4: Симуляция выбора родителей
Каждый потомок содержит информацию о генах и отца и от матери. Вообще говоря, это можно обеспечить различными способами, однако в нашем случае можно использовать т.н. "кроссовер" (cross-over). Пусть мать содержит следующий набор решений: a₁,b₁,c₁,d₁, а отец - a₂,b₂,c₂,d₂, тогда возможно 6 различных кроссоверов (| = разделительная линия):

Хромосома-отец	Хромосома-мать	Хромосома-потомок
a₁ \| b₁,c₁,d₁	a₂ \| b₂,c₂,d₂	a₁,b₂,c₂,d₂ or a₂,b₁,c₁,d₁
a₁,b₁ \| c₁,d₁	a₂,b₂ \| c₂,d₂	a₁,b₁,c₂,d₂ or a₂,b₂,c₁,d₁
a₁,b₁,c₁ \| d₁	a₂,b₂,c₂ \| d₂	a₁,b₁,c₁,d₂ or a₂,b₂,c₂,d₁

Таблица 5: Кроссоверы между родителями
Есть достаточно много путей передачи информации потомку, и кроссовер - только один из них. Расположение разделителя может быть абсолютно произвольным, как и то, отец или мать будут слева от черты.

А теперь попробуем проделать это с нашими потомками

Хромосома-отец	Хромосома-мать	Хромосома-потомок
(13 \| 5,7,3)	(1 \| 28,15,3)	(13,28,15,3)
(9,13 \| 5,2)	(14,9 \| 2,4)	(9,13,2,4)
(13,5,7 \| 3)	(9,13,5 \| 2)	(13,5,7,2)
(14 \| 9,2,4)	(9 \| 13,5,2)	(14,13,5,2)
(13,5 \| 7, 3)	(9,13 \| 5, 2)	(13,5,5,2)

Таблица 6: Симуляция кроссоверов хромосом родителей
Теперь мы можем вычислить коэффициенты выживаемости (fitness) потомков.

Хромосома-потомок	Коэффициент выживаемости
(13,28,15,3)	\|126-30\|=96
(9,13,2,4)	\|57-30\|=27
(13,5,7,2)	\|57-30\|=22
(14,13,5,2)	\|63-30\|=33
(13,5,5,2)	\|46-30\|=16

Таблица 7: Коэффициенты выживаемости потомков (fitness)
Средняя приспособленность (fitness) потомков оказалась 38.8, в то время как у родителей этот коэффициент равнялся 59.4. Следующее поколение может мутировать. Например, мы можем заменить одно из значений какой-нибудь хромосомы на случайное целое от 1 до 30.

Продолжая таким образом, одна хромосома в конце концов достигнет коэффициента выживаемости 0, то есть станет решением.

Системы с большей популяцией (например, 50 вместо 5-и сходятся к желаемому уровню (0) более быстро и стабильно.

к началу

C++ код.

Класс на C++ требует 5 значений при инициализации: 4 коэффициента и результат. Для вышепривиденного примера это будет выглядеть так:

CDiophantine dp(1,2,3,4,30);

Затем, чтобы решить уравнение, вызовите функцию Solve() , которая возвратит аллель, содержащую решение. Вызовите GetGene(), чтобы получить ген с правильными значениями a, b, c, d. Стандартная процедура main.cpp, использующая этот класс, может быть такой:

#include "<iostream.h>"
#include "diophantine.h"

void main() {

   CDiophantine dp(1,2,3,4,30);

   int ans;
   ans = dp.Solve();
   if (ans == -1) {
      cout << "No solution found." << endl;
   } else {
      gene gn = dp.GetGene(ans);

      cout << "The solution set to a+2b+3c+4d=30 is:\n";
      cout << "a = " << gn.alleles[0] << "." << endl;
      cout << "b = " << gn.alleles[1] << "." << endl;
      cout << "c = " << gn.alleles[2] << "." << endl;
      cout << "d = " << gn.alleles[3] << "." << endl;
   }
}

к началу

CDiophantine

Первым делом посмотрим на заголовок класса:


#include <stdlib.h>

#include <time.h>



#define MAXPOP 25



struct gene {

   int alleles[4];

   int fitness;

   float likelihood;



   // Test for equality.

   operator==(gene gn) {

      for (int i=0;i<4;i++) {

         if (gn.alleles[i] != alleles[i]) return false;

      }



      return true;

   }

};



class CDiophantine {

   public:

      CDiophantine(int, int, int, int, int);

      int Solve();



      // Returns a given gene.

      gene GetGene(int i) { return population[i];}



   protected:

      int ca,cb,cc,cd;

      int result;

      gene population[MAXPOP];



      int Fitness(gene &);

      void GenerateLikelihoods();

      float MultInv();inverse.

      int CreateFitnesses();

      void CreateNewPopulation();

      int GetIndex(float val);



      gene Breed(int p1, int p2);



};

Существуют две структуры: gene и класс CDiophantine. gene используется для слежения за различными наборами решений. Создаваемая популяция - популяция ген. Эта генетическая структура отслеживает свои коэффициенты выживаемости и вероятность оказаться родителем. Также есть небольшая функция проверки на равенство, просто чтобы сделать кое-какой другой код покороче. Теперь по функциям:

Fitness function
вычисляет коэффициент выживаемости ( приспособленности - fitness) каждого гена. В нашем случае это - модуль разности между желаемым результатом и полученным значением. Этот класс использует две функции: первая вычисляет все коэффициенты, а вторая - поменьше (желательно сделать ее inline) вычисляет коэффициент для какого-то одного гена.


int CDiophantine::Fitness(gene &gn) {

   int total = ca * gn.alleles[0] + cb * gn.alleles[1]

             + cc * gn.alleles[2] + cd * gn.alleles[3];



   return gn.fitness = abs(total - result);

}



int CDiophantine::CreateFitnesses() {

   float avgfit = 0;

   int fitness = 0;

   for(int i=0;i<MAXPOP;i++) {

      fitness = Fitness(population[i]);

      avgfit += fitness;

      if (fitness == 0) {

         return i;

      }

   }



   return 0;

}

Заметим, что если fitness = 0, то найдено решение - возврат. После вычисления приспособленности (fitness) нам нужно вычислить вероятность выбора этого гена в качестве родительского.

Likelihood functions
Как и было объяснено, вероятность вычисляется как сумма обращенных коэффициентов, деленная на величину, обратную к коэффициенту данному значению. Вероятности кумулятивны (складываются), что делает очень легким вычисления с родителями. Например:

Хромосома Вероятность

1 (1/84)/0.135266 = 8.80%

2 (1/24)/0.135266 = 30.8%

3 (1/26)/0.135266 = 28.4%

4 (1/133)/0.135266 = 5.56%

5 (1/28)/0.135266 = 26.4%

В программе, при одинаковых начальных значениях, вероятности сложатся: представьте их в виде кусков пирога. Первый ген - от 0 до 8.80%, следующий идет до 39.6% (так как он начинает 8.8). Таблица вероятностей будет выглядеть приблизительно так:

Хромосома Вероятность (smi = 0.135266)

1 (1/84)/smi = 8.80%

2 (1/24)/smi = 39.6% (30.6+8.8)

3 (1/26)/smi = 68% (28.4+39.6)

4 (1/133)/smi = 73.56% (5.56+68)

5 (1/28)/smi = 99.96% (26.4+73.56)

Последнее значение всегда будет 100. Имея в нашем арсенале теорию, посмотрим на код. Он очень прост: преобразование к float необходимо для того, чтобы избежать целочисленного деления. Есть две функции: одна вычисляет smi, а другая генерирует вероятности оказаться родителем.


float CDiophantine::MultInv() {

   float sum = 0;



   for(int i=0;i<MAXPOP;i++) {

      sum += 1/((float)population[i].fitness);

   }



   return sum;

}



void CDiophantine::GenerateLikelihoods() {

   float multinv = MultInv();



   float last = 0;

   for(int i=0;i<MAXPOP;i++) {

      population[i].likelihood = last

      = last + ((1/((float)population[i].fitness) / multinv) * 100);

   }

}

Итак, у нас есть и коэффициенты выживаемости (fitness) и необходимые вероятности (likelihood). Можно переходить к размножению (breeding).

Breeding Functions
Функции размножения состоят из трех: получить индекс гена, отвечающего случайному числу от 1 до 100, непосредственно вычислить кроссовер двух генов и главной функции генерации нового поколения. Рассмотрим все эти функции одновременно и то, как они друг друга вызывают. Вот главная функция размножения:


void CDiophantine::CreateNewPopulation() {

   gene temppop[MAXPOP];



   for(int i=0;i<MAXPOP;i++) {

      int parent1 = 0, parent2 = 0, iterations = 0;

      while(parent1 == parent2 || population[parent1]

            == population[parent2]) {

         parent1 = GetIndex((float)(rand() % 101));

         parent2 = GetIndex((float)(rand() % 101));

         if (++iterations > (MAXPOP * MAXPOP)) break;

      }



      temppop[i] = Breed(parent1, parent2);  // Create a child.

   }



   for(i=0;i<MAXPOP;i++) population[i] = temppop[i];

}

Итак, первым делом мы создаем случайную популяцию генов. Затем делаем цикл по всем генам. Выбирая гены, мы не хотим, чтобы они оказались одинаковы (ни к чему скрещиваться с самим собой :), и вообще - нам не нужны одинаковые гены (operator = в gene). При выборе родителя, генерирем случайное число, а затем вызываем GetIndex. GetIndex использует идею кумулятивности вероятностей (likelihoods), она просто делает итерации по всем генам, пока не найден ген, содержащий число:


   int CDiophantine::GetIndex(float val) {

   float last = 0;

   for(int i=0;i<MAXPOP;i++) {

      if (last <= val && val <= population[i].likelihood) return i;

      else last = population[i].likelihood;

   }



   return 4;

}

Возвращаясь к функции CreateNewPopulation(): если число итераций превосходит MAXPOP², она выберет любых родителей. После того, как родители выбраны, они скрещиваются: их индексы передаются вверх на функцию размножения (Breed). Breed function возвращает ген, который помещается во временную популяцию. Вот код:


gene CDiophantine::Breed(int p1, int p2) {

   int crossover = rand() % 3+1;

   int first = rand() % 100;



   gene child = population[p1];



   int initial = 0, final = 3;

   if (first < 50) initial = crossover;

   else final = crossover+1;



   for(int i=initial;i<final;i++) {

      child.alleles[i] = population[p2].alleles[i];

      if (rand() % 101 < 5) child.alleles[i] = rand() % (result + 1);

   }



   return child;

}

В конце концов мы определим точку кроссовера. Заметим, что мы не хотим, чтобы кроссовер состоял из копирования только одного родителя. Сгенерируем случайное число, которое определит наш кроссовер. Остальное понятно и очевидно. Добавлена маленькая мутация, влияющая на скрещивание. 5% - вероятность появления нового числа.

И, наконец...
Теперь уже можно взглянуть на функцию Solve(). Она всего лишь итеративно вызывает вышеописанные функции. Заметим, что мы присутствует проверка: удалось ли функции получить результат, используя начальную популяцию. Это маловероятно, однако лучше проверить.


int CDiophantine::Solve() {

  int fitness = -1;



  // Generate initial population.

  srand((unsigned)time(NULL));



  for(int i=0;i<MAXPOP;i++) {

    for (int j=0;j<4;j++) {

      population[i].alleles[j] = rand() % (result + 1);

    }

  }



  if (fitness = CreateFitnesses()) {

    return fitness;

  }



  int iterations = 0;

  while (fitness != 0 || iterations < 50) {

    GenerateLikelihoods();

    CreateNewPopulation();

    if (fitness = CreateFitnesses()) {

      return fitness;

    }



    iterations++;

  }



  return -1;

}

назад к списку статей | вверх