1 грамм бактерий = 931322 ГБ информации
Опубликовано ssu-filippov в 1 декабря, 2010 - 02:29
Новый биологический принцип хранения
информации был разработан командой CUHK iGEM 2010, состоящей из
преподавателей и студентов Китайского университета в Гонконге. Работа
была выполнена для участия команды в конкурсе iGEM этого года. В этом
году ученые собираются использовать бактерии не только для хранения
информации, но и объединить вместе с этим стойкую систему биологического
шифрования данных. Естественно, что все технологии манипулирования ДНК и
анализа генома, использованные в данной работе, чрезвычайно дороги, что
пока не позволяет рассматривать данную технологию с точки зрения
практического применения.
Использование бактерий в качестве устройств хранения информации –
идея не новая, она была предложена группой Бэнкрофта в 2001 году, а
группа ученых Ячи занималась хранением информации в геноме бактерий с
2007 года. Ученые выяснили, что для того, что бы обеспечить надежное
хранение данных необходимоы правильно подойти к используемому виду
бактерий. Использование Bacillus subtilis обеспечит сверхнадежное
хранение благодаря тому, что бактерии размножатся и сделают
дополнительные копии данных, микроорганизмы Deinococcus radiodurans
могут выдержать радиацию ядерного взрыва и сохранить при этом записанные
данные.
Рис. 1.
Кодирование информации в ДНК называется рекомбинацией ДНК и
производится сложными методами генной инженерии. Для преобразования в
генный вид информация подвергается перекодированию. Каждый байт
информации, содержащий 8 бит, кодируется двумя четырехбитными
последовательностями, соответствующими различным основам ДНК. Значение
0 соответствует аденозину, 1 – тимину, 2 – цитозин и 3 – гуанину. С
математической точки зрения такие преобразования достаточно просты и
понятны. После перекодирования информация подвергается сжатию с
использованием алгоритмов Хоффмана и LZ77, что позволяет сократить объем
информации и избавиться от повторяющихся блоков.
Используя современные технологии кодирования ДНК невозможно вместить
достаточно объемную информацию в одну последовательность. Таким образом
информация должна фрагментироваться, каждый фрагмент обрамляется
специальными метками начала и контрольной суммой, позволяющей
контролировать и корректировать ошибки (мутации). После этого начинается
непосредственно сборка ДНК и ее внедрение в геном бактерий.
Рис. 2.
Чтение информации, записанной биологическим образом, тоже является
достаточно сложной операцией. Но, с появлением новых современных
устройств и технологий это в будущем будет делаться гораздо проще.
Ну, и наконец можно привести несколько фактов. В одной бактерии вида
E. Coli, а именно этот вид использовался командой iGEM, можно сохранить
всего один килобайт информации. А в одном грамме живого веса содержится
такое количество особей этого вида, что общее количество информации
составит 931322 ГБ. 1. DailyTechInfo http://www.nanonewsnet.ru/news/2010/1-gramm-bakterii-931322-gb-informatsii
|