Читаем без скачивания Игра разума. Как Клод Шеннон изобрел информационный век - Джимми Сони
Шрифт:
Интервал:
Закладка:
Генетическая алгебра Шеннона была, по сути, попыткой повторно воссоздать для клеток то, что он смог создать для электрических схем. До Шеннона электрические схемы можно было изобразить на доске, но не в виде уравнений. Конечно, гораздо неудобнее манипулировать диаграммой, чем уравнением. Но никому еще не удавалось даже начать применять математические правила к чертежу. Все в работе Шеннона было построено на понимании того, что электрические схемы были чисто символическими. А что если гены тоже чисто символичны? Подобно тому, как булева алгебра помогла автоматизировать ментальные усилия вычислительных машин, алгебра генетики могла помочь генетикам предсказывать ход эволюции. Трюк, как и прежде, заключался в том, чтобы абстрагироваться оттого, что было перед глазами. Забудьте о сотне переключателей в коробке, забудьте о том, что 4598 означает игру в шахматы.
«Значительная часть силы и простоты любой математической теории, – писал Шеннон, – зависит от использования компактного и наглядного символического изображения, которое, тем не менее, всесторонне описывает изучаемые концепции». На самом деле, эта мысль была уже прочно вбита в головы математиков, которые знали, к примеру, что Ньютон и Лейбниц открыли дифференциальное исчисление почти одновременно, но система символов Лейбница победила как более наглядная. Но какой должна быть наглядная система символизации целой популяции людей, выраженная в генах?
Как понял Шеннон, изучив эту область, «гены заключены в палочковидных телах, именуемых хромосомами; большое количество генов лежат бок о бок по всей длине хромосомы». (Сами хромосомы состоят из молекул ДНК, которые кодируют гены четырехбуквенными сочетаниями, хотя об этом никто еще не знал.)
У большинства видов, состоящих из более чем одной клетки, особи имеют определенное количество парных хромосом (у человека их двадцать три пары). У тех видов, которые размножаются половым путем, одна хромосома передается от матери, а одна – от отца. Чтобы было понятнее, Шеннон предложил рассматривать организм всего с двумя парами хромосом и шестнадцатью генами. Свой генетический код он представил следующим образом:
A1B1C3D5 E4F1G6H1
A3B1C4D3 E4F2G2H2
Левая верхняя комбинация A1В1С3D5 – это хромосома от одного родителя, а левая нижняя комбинация А3В1С4D3 – хромосома от второго родителя. Вместе они образуют одну хромосомную пару. Колонка из A1 и А3 (буквы выделены жирным шрифтом) составляет позицию генов. Если брать их по отдельности, то A1 – это аллель, или ген от одного родителя с одной наследуемой чертой. Ограниченное количество аллелей возможно в любой позиции генов, а взаимодействие аллелей от матери и отца определяет те качества, которые наследует их потомство. Шеннон перевел в символы возможные аллели с помощью чисел в нижнем индексе. А1 и А3 – это различные проявления одной черты (к примеру, цвета волос – единица обозначает каштановый, а двойка блондин), а качество, которое превалирует, зависит от того, какой ген доминирует.
Теперь еще больше упростим эту схему. Допустим, мы хотим изучить целую популяцию индивидуумов, выбрав всего две черты, А и В.
А что если целую популяцию и все ее релевантные гены можно представить в виде всего одного алгебраического выражения?
И снова каждый ряд символов получен от одного родителя, а каждая колонка обозначает позицию гена. Скажем, существуют две возможные аллели для А (к примеру, каштановые и светлые волосы) и три для В (высокий, среднего роста и низкорослый). В этом случае получится двадцать один генетически отличный от других индивидуум (поверьте нам), варьирующийся от
A1B1
A1B1
до
A1B3
A2B2
Итак, как мы можем смоделировать генетические изменения населения со временем, или предсказать результаты его произвольного смешения с другой группой? Как будет выглядеть новая популяция через пять поколений? А через тысячу поколений?
Если бы мы были наделены неограниченным количеством времени и бумаги, то могли бы произвести расчеты отдельно для каждого из двадцати одного индивидуума, соединившихся в произвольном порядке с представителями другой группы. В результате мы получили бы одно поколение, а дальше мы могли бы вновь и вновь повторять этот процесс до бесконечности. А что если целую популяцию и все ее релевантные гены можно представить в виде всего одного алгебраического выражения? Оно должно быть, как отметил Шеннон, одновременно компактным и наглядным: достаточно компактным, чтобы использовать его в качестве единственной величины в уравнении, и наглядным, чтобы его можно было «разобрать» на все его составляющие, когда нам нужно остановить циклы рекомбинации и изучить результаты.
Размышляя подобным образом, Шеннон изобрел символ, чтобы суммировать всю популяцию: λhijk.
Данное выражение действительно, как он указывал, является «целой группой цифр». λ – это популяция в целом, h, j, i и k – это гены. По мере того как мы узнаем ряд генов, возможных для данной популяции, мы можем заменить эти буквы рядом цифр. Колонка hj – это одна позиция гена, и так как первая рассматриваемая черта имеет две аллели, значение h или j может варьироваться от 1 до 2. Колонка ik – это другая позиция гена, и так как вторая рассматриваемая черта имеет три аллели, значение i или k может варьироваться от 1 до 3. λ1322 теперь означает не одного индивидуума,