О квази генетическом коде

Творческая группа юных математиков – программистов, руководимая Братом Михаилом Шишигиным.

(Церковь Христа Спасителя)

О КВАЗИ ГЕНЕТИЧЕСКОМ КОДЕ

Аннотация

Приводится класс полимино, моделирующий фундаментальное свойство генетического кода, а именно то, что 20 различных аминокислот, входящих в структуру белков, образованы из 4 различны нуклеотидов. Этот класс полимино назван квазигенетическим кодом.

Вводятся унарные операции < - , -1, * > над матрицами 4*2

a1

a2

W =

b1

b2

c1

c2

d1

d2

состоящими из элементов 0, 1, 2, 3, а именно:

a2

a1

4 - a2

  4 - a1

 2 - d1

2 - d2

W= -

b2

b1

=

4 - b2

  4 - b1

W-1  

=

 2 - c1

=

- c2

c2

c1

=

4 - c2

  4 - c1

,

 2 - b1

2 - b2

d2

d1

4 - d2

  4 - d1

 2 - a1

2 - a2

=

2

2

──

d1

d2

2

2

c1

c2

,

2

2

b1

b2

2

2

a1

a2

W* =  (W)-1, a + b = (a + b)(mod 4), a - b = (a - b)(mod 4),

a, b Î { 0, 1, 2, 3}.

W = W,  (W-1) = (W)-1.

Используя введенные операции над матрицами 4*2, элементы квазигенетического кода можно записать так:

a, b, g, d, l, t, a, b,  g,  d, a-1, b-1, g-1, d-1, l-1, t-1, a*, b*, g*, d*, где

 a =

3

1

  b=

3

2

 g =

3

1

2

1

2

0

1

3

0

1

0

1

2

1

1

3

1

3

0

1

2

1

  l =

3

1

 t =

3

1

  d =

0

1

3

1

3

1

3

1

3

1

1

3

1

3

1

3

3

1

О КВАЗИГЕНЕТИЧЕСКОМ КОДЕ

Данная работа посвящена геометрическим структурам, моделирующим фундаментальное свойство генетического кода, а именно то, что 20 различных аминокислот, входящих в структуру белков, образованы из 4 различных нуклеотидов.

Положим, что прямоугольник размером  4*2  должен быть покрыт прямоугольниками размером  2*1 (домино). Причём, нечётное число домино должно выходить за пределы как стороны  AB, так и стороны CD  (рис. 1).

B
C
A
D

Рис. 1

Покрытие, в котором домино, выходящие за пределы сторон  AB и CD, однозначно определяют структуру покрытия прямоугольника ABCD, назовём жестким покрытием. Например, покрытие  a) (рис. 2.) является жестким, а покрытия  b) и  c) (рис. 2.) такими не являются.

B
C
B
C
B
C
A
D
A
D
A
D

a)

b)

c)

Рис. 2

Прямоугольник размером  4*2n  разобьём вертикалями на  n  прямоугольников шириной в длину домино, которые пронумеруем слева направо и назовём шагами. Множество жестких покрытий прямоугольника размером  4*2  назовём квазигенетическим кодом. Покрытие прямоугольника размером 4*2n , при котором покрытие каждого шага представляет собой жесткое покрытие, назовём квазигенетическим покрытием.

Будем считать, что клетка прямоугольника  ABCD  находится в состоянии 0, 1, 2, 3, если она покрыта домино, ориентированным соответственно вверх, вправо, вниз, влево.

0

3

1

2

Рис. 3

Матрицу размером  4*2 , соответствующую жесткому покрытию прямоугольника ABCD будем называть квазинуклеотидной матрицей, либо квазинуклеотидом. Матрицу размером 4*2n , соответствующую квазигенетическому покрытию прямоугольника размером 4*2n , будем называть белковой матрицей.

Методом последовательного исключения (перебором) можно показать, что существуют 20 различных, жестких покрытий прямоугольника ABCD. в Таблице 1 приведены все 20 жестких покрытий прямоугольника  4*2 и соответствующие им квазинуклеотидные матрицы.

Таблице 1

3

1

3

2

3

1

a=

2

1

b=

2

0

g =

1

3

0

1

0

1

2

1

1

3

1

3

0

1

b=

2

1

2

1

0

2

d =

0

1

3

0

3

1

1

3

1

3

b*=

1

3

d-1=

1

3

3

2

3

1

2

0

2

1

0

1

0

1

1

3

b-1=

1

3

g-1=

2

1

a-1=

2

1

2

1

0

1

0

1

0

2

1

3

3

1

3

0

3

1

3

1

3

2

3

1

a =

3

2

 d =

3

0

l =

3

1

3

0

3

1

3

1

1

3

1

3

1

3

l = l

3

1

3

1

3

2

  g =

1

3

 t =

3

1

g*=

3

0

3

2

1

3

1

3

3

0

3

1

3

1

3

1

 t-1 =

1

3

 t-1 =  t*    ,     t =   t  , l-1 = l*

3

1

3

1

l-1 =

1

3

1

3

1

3

a*=

3

2

d*=

3

1

3

1

3

0

3

2

3

1

3

1

3

0

3

1

Пусть записи   a + b , a - b  обозначают (a + b)(mod 4),  (a - b)(mod 4), где

a, b Î { 0, 1, 2, 3}.

                      

Введём унарные операции     < - , -1, * >    над матрицей  4*2

a1

a2

W =

b1

b2

c1

c2

d1

d2

,

состоящей из элементов 0, 1, 2, 3.

Положим

a2

a1

4 - a2

  4 - a1

 2 - d1

2 - d2

W= -

b2

b1

=

4 - b2

  4 - b1

W-1  

=

 2 - c1

=

2 - c2

c2

c1

=

4 - c2

  4 - c1

,

 2 - b1

2 - b2

d2

d1

4 - d2

  4 - d1

 2 - a1

2 - a2

W =  W ,   (W-1)-1 =  W.

=

2

2

──

d1

d2

2

2

c1

c2

,

2

2

b1

b2

2

2

a1

a2

 2 +  d2

d1

 2 +  c2

2 +  c1    .

 2 +  b2

2 +  b1

 2 +  a2

2 +  a1

Положим

W*  =

W* =  (W)-1,                 

Нетрудно показать, что         W = W,  (W-1) = (W)-1, (W-1)-1 =  W.

Используя введенные операции над матрицами 4*2,  квазинуклеотидные матрицы можно записать так  (см. Таблицу 1) :

a, b, g, d, l, t, a, b,  g,  d, a-1, b-1, g-1, d-1, l-1, t-1, a*, b*, g*, d*.

Введём понятие генетической информации белковой матрицы. Последовательность из количества единичных элементов в правых столбцах квазинуклеотидных подматриц белковой матрицы будем называть генетической информацией. Например, на рис. 4 показано квазигенетическое покрытие прямоугольника размером 4´22 , которому соответствует белковая матрица с генетической информацией 1 3 3 1 3 3 1 3 3 1 3.

1

2

3

4

5

6

7

8

9

10

11

1

3

3

1

3

3

1

3

3

1

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

b

a

l

d

d

l

a

g

t-1

g

a

Рис. 4

Используя «жёсткость» упаковки квазигенетического  покрытия, можно показать, что квазигенетический  код обладает высокой помехоустойчивостью.

Предложение 1. По двум любым строкам квазигенетического покрытия прямоугольника, размером 4´2n (n>1) , можно полностью восстановить покрытие, а, следовательно, и генетическую информацию.

Предложение 2. Зная жёсткие покрытия на нечётных шагах квазигенетического покрытия прямоугольника размером, 4´2(2k+1), можно полностью восстановить покрытие, а, следовательно, и генетическую информацию.

Дальнейшие исследования должны показать плодотворность идеи квазигенетического кода.

Приложение.

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3

2

1

3

1

3

1

3

2

2

1

3

1

3

1

3

1

3

1

3

1

3

1

0

2

2

1

3

1

3

0

0

1

3

1

3

2

1

3

1

3

1

3

2

1

3

0

0

1

3

1

3

1

3

1

3

1

3

0

2

1

3

1

3

2

0

1

1

3

1

3

1

3

1

3

1

3

1

3

1

3

0

1

3

1

3

0

2

3