1 грамм бактерий = 931322 ГБ информации
Новый биологический принцип хранения информации был разработан
командой CUHK iGEM 2010, состоящей из преподавателей и студентов
Китайского университета в Гонконге. Работа была выполнена для участия
команды в конкурсе iGEM этого года. В этом году ученые собираются
использовать бактерии не только для хранения информации, но и объединить
вместе с этим стойкую систему биологического шифрования данных.
Естественно, что все технологии манипулирования ДНК и анализа генома,
использованные в данной работе, чрезвычайно дороги, что пока не
позволяет рассматривать данную технологию с точки зрения практического
применения.
Использование бактерий в качестве устройств хранения информации –
идея не новая, она была предложена группой Бэнкрофта в 2001 году, а
группа ученых Ячи занималась хранением информации в геноме бактерий с
2007 года. Ученые выяснили, что для того, что бы обеспечить надежное
хранение данных необходимоы правильно подойти к используемому виду
бактерий. Использование Bacillus subtilis обеспечит сверхнадежное
хранение благодаря тому, что бактерии размножатся и сделают
дополнительные копии данных, микроорганизмы Deinococcus radiodurans
могут выдержать радиацию ядерного взрыва и сохранить при этом записанные
данные.
Кодирование информации в ДНК называется рекомбинацией ДНК и
производится сложными методами генной инженерии. Для преобразования в
генный вид информация подвергается перекодированию. Каждый байт
информации, содержащий 8 бит, кодируется двумя четырехбитными
последовательностями, соответствующими различным основам ДНК. Значение
0 соответствует аденозину, 1 – тимину, 2 – цитозин и 3 – гуанину. С
математической точки зрения такие преобразования достаточно просты и
понятны. После перекодирования информация подвергается сжатию с
использованием алгоритмов Хоффмана и LZ77, что позволяет сократить объем
информации и избавиться от повторяющихся блоков.
Используя современные технологии кодирования ДНК невозможно вместить
достаточно объемную информацию в одну последовательность. Таким образом
информация должна фрагментироваться, каждый фрагмент обрамляется
специальными метками начала и контрольной суммой, позволяющей
контролировать и корректировать ошибки (мутации). После этого начинается
непосредственно сборка ДНК и ее внедрение в геном бактерий.
Чтение информации, записанной биологическим образом, тоже является
достаточно сложной операцией. Но, с появлением новых современных
устройств и технологий это в будущем будет делаться гораздо проще.
Ну, и наконец можно привести несколько фактов. В одной бактерии вида
E. Coli, а именно этот вид использовался командой iGEM, можно сохранить
всего один килобайт информации. А в одном грамме живого веса содержится
такое количество особей этого вида, что общее количество информации
составит 931322 ГБ.
Источник(и):
1. DailyTechInfo
|