1 грамм бактерий = 931322 ГБ информации

биoлoгичeский принцип xрaнeния инфoрмaции

Нoвый биoлoгичeский принцип xрaнeния инфoрмaции был рaзрaбoтaн кoмaндoй CUHK iGEM 2010, сoстoящeй из прeпoдaвaтeлeй и студeнтoв Китaйскoгo унивeрситeтa в Гoнкoнгe.

Рaбoтa былa выполнена в целях участия команды в конкурсе iGEM этого года. Естественно, что все технологии манипулирования ДНК и анализа генома, использованные в данной работе, существенно дороги, что пока не позволяет рассматривать данную технологию с точки зрения практического применения.

Использование бактерий в качестве устройств хранения информации — идея не новая, она была предложена группой Бэнкрофта в 2001 году, а партия ученых Ячи занималась хранением информации в геноме бактерий с 2007 года. Ученые выяснили, что для того, чтобы обеспечить надежное оберегание данных необходимоы правильно подойти к используемому виду бактерий.

Использование Bacillus subtilis обеспечит сверхнадежное хранение благодаря тому, что бактерии размножатся и сделают дополнительные копии данных, микроорганизмы Deinococcus radiodurans могут выдержать радиацию ядерного взрыва и сохранить при этом записанные данные.

Bacillus subtilis

Кодирование информации в ДНК называется рекомбинацией ДНК и производится сложными методами генной инженерии. Для преобразования в генный вид информация подвергается перекодированию. Каждый байт информации, содержащий 8 бит, кодируется двумя четырехбитными последовательностями, соответствующими различным основам ДНК.

Значение 0 соответствует аденозину, 1 — тимину, 2 — цитозин и 3 — гуанину. С математической точки зрения такие преобразования просты и понятны. После перекодирования информация подвергается сжатию с использованием алгоритмов Хоффмана и LZ77, что позволяет сократить объем информации и избавиться от повторяющихся блоков.

Используя современные технологии кодирования ДНК, можно вместить достаточно объемную информацию в одну последовательность. Таким образом информация должна фрагментироваться, отдельный фрагмент обрамляется специальными метками начала и контрольной суммой, позволяющей удостоверять и корректировать ошибки (мутации). После этого начинается непосредственно сборка ДНК и ее внедрение в геном бактерий.

биoлoгичeский принцип xрaнeния инфoрмaции

Произнесение информации, записанной биологическим образом, тоже является достаточно сложной операцией. Но, с появлением новых современных устройств и технологий это в будущем будет делаться гораздо проще.

Ну, и наконец можно привести несколько фактов. Coli, а именно настоящий вид использовался командой iGEM, можно сохранить всего один килобайт информации. А в одном грамме живого веса содержится такое количество особей сего вида, что общее количество информации составит 931322 ГБ.