Акрамя жорсткага дыска: кадаванне дадзеных у ДНК

Гэты артыкул з'яўляецца часткай серыі пра тое, як кампаніі OS OS (OSF) радыкальна пераглядае наша будучыню, перапісваючы жыццё на аперацыйныя сістэмы. Ці, як мы аддаем перавагу думаць пра гэта: Крок 1: Пакладзіце ўвагнутасць ва Сусвет. І крок 2: Перапішыце Сусвет. Вы можаце ўбачыць поўную калекцыю АСФ тут і прачытаць больш пра стварэнне біялагічнай імуннай сістэмы.

Абдумваючы будучыню, я люблю ўяўляць, як будзе думаць наша паўсядзённае жыццё сёння. Што сёння ўяўляецца нам навуковай фантастыкай, але "будзе нармальным" праз 50 гадоў? Якія неэфектыўныя і нахабныя рэчы мы робім сёння, каб будучыя пакаленні азіраліся і смяяліся?

Бачыць за межамі магчымасці рэдкае майстэрства. Магчымасць праектавання і будаўніцтва за межамі магчымасці яшчэ больш рэдкая. У сукупнасці гэта ўнікальны набор навыкаў і здольнасцей, якія маюць усе заснавальнікі АСФ. Самае галоўнае, што яны вырашылі засяродзіць свае здольнасці на вырашэнні самых вялікіх праблем, з якімі сутыкаецца чалавецтва.

Але хто яны? Што прымушае іх галадаць? Чаму гэта супраць іншых? І як іх тэхналогіі могуць змяніць свет? Гэта іх гісторыі.

I. Больш дадзеных, чым мы ведаем, што рабіць

Мы знаходзімся ў залатым веку інфармацыі. За апошнія два гады было сабрана больш за 90% усіх дадзеных, створаных за ўсю гісторыю чалавецтва. Насельніцтва ў свеце стварае 2,5 квінтліона (10 фунтаў) байт дадзеных кожны дзень, і кожны чалавек хутка генеруе 1,7 МБ дадзеных кожную секунду свайго жыцця. І гэта толькі людзі. Зямля генеруе на парадкі больш дадзеных, чым кожная хвіліна.

Хуткасць, з якой мы робім дадзеныя, пераўзыходзіць нашу здольнасць захоўваць, транспартаваць і атрымліваць доступ да іх. Гэта праблематычна, таму што для кіравання гэтым масіўным павелічэннем патрабуецца энергія (ІТ-індустрыя спальвае паміж 7–12% сусветнай энергіі кожны год!) І фізічную прастору. Гэта крыху процідзеянне, але лічбавае сховішча таксама займае прастору і энергію. Для эканоміі ў воблаку неабходныя велізарныя склады сервераў, якія спажываюць вялікую колькасць энергіі для падтрымання патрэбнай тэмпературы і вільготнасці.

Нядаўна, як некалькі дзесяцігоддзяў таму, для захавання нашых дадзеных мы ў асноўным абапіраліся на добрую ручку і паперу. Затым мы перайшлі на магнітныя стужкі і дыскі, перш чым перайсці на лічбавае сховішча. У пэўным сэнсе выпускны быў не ўсім прагрэсам: дадзеныя ўсё яшчэ павінны быць перанесены кожнаму пакаленню на найноўшую тэхналогію, каб гарантаваць, што яна яшчэ можа быць захавана і прачытана.

Як нашы здольнасці захоўвання ідуць у нагу з магчымасцю генерацыі і запісу дадзеных? Як мы можам захоўваць дадзеныя на носьбіце, які ніколі не састарэе? Як мы можам захаваць нашу гісторыю доўга ў будучыні?

Што рабіць, калі мы змаглі знайсці спосаб захавання сусветнага банка лічбавых ведаў такім чынам, каб не падвяргаліся глабальнай ці рэгіянальнай страты электраэнергіі, спажывалі долю энергетычных рэсурсаў існуючай ІТ-інфраструктуры і былі эканамічна выгаднымі?

Адказ быў увесь гэты час вакол нас. У нас. Гэта мы: ДНК. Што рабіць, калі мы маглі б захоўваць усю інфармацыю ў свеце ў ДНК?

Нядаўна я пазнаёміўся з Каталогам, які спрабаваў зрабіць менавіта гэта, і адразу зразумеў, што яны да нечага вялікага.

II. Невялікі, эфектыўны і даўгавечны: чаму ДНК - гэта будучыня захоўвання дадзеных

Сузаснавальнікі каталога Hyunjun Park і Nathaniel Roquet працуюць над тым, каб зрабіць ДНК новага пакалення асноўнай асяроддзем захоўвання лічбавых дадзеных.

Парк мае кандыдат навук. у мікрабіялогіі; Ракет мае кандыдат навук. у біяфізіцы. Яны сустрэліся ў Масачусецкім тэхналагічным інстытуце (MIT) і ўбачылі змяняецца ў свеце магчымасць вырашыць праблему захоўвання дадзеных.

Каталог вынайшаў метадалогію, якая дазволіла б ім змясціць усе дадзеныя свету ў шафу і захаваць яго на ... вельмі і вельмі доўга.

"ДНК - гэта надзвычай стабільны матэрыял", - растлумачыў Парк.

Мы ведаем гэта, таму што мы выявілі ў асноўным непашкоджаную ДНК ад захаваных жывёл сотняў тысяч гадоў.

"Вы бачыце такія рэчы, як коні, якія былі замарожаныя ў вечнай мерзлаце ў Канадзе на 700 000 гадоў, і вы ўсё яшчэ можаце прачытаць геном гэтай жывёлы", - растлумачыў Парк. “Той факт, што наша генетычная інфармацыя закадаваная ў носьбіце, азначае, што мы заўсёды зможам прачытаць гэта. Нам не трэба турбавацца аб тэхналогіі чытання, якая развіваецца ў асяроддзі ».

Фота: pip / photocase.com

Хоць ранні поспех у захоўванні дадзеных у выглядзе нітак ДНК з выкарыстаннем сінтэтычнай біялогіі быў дасягнуты ў 1986 годзе, сама практыка па-ранейшаму застаецца адносна нявызначанай для мэт масавага прыняцця. (У апошні час цэлыя кнігі і кароткаметражныя фільмы захоўваюцца як ДНК, як доказ прынцыпу.)

Але "Каталог" з'яўляецца першай кампаніяй, якая спрабуе на маштабаванасць на рынку, які атрымлівае выгаду ад грувасткага абсталявання і планаванага састарэння. Гэта таму, што яны знайшлі спосаб, які, магчыма, на працягу некалькіх гадоў зробіць захоўванне ДНК таннейшым, чым сёння.

"Зараз у чалавека няма магчымасці фізічна валодаць вельмі вялікімі дадзенымі. Але проста захаваць капсулу ДНК, якая кадуе петабайт дадзеных ", - сказаў Парк.

"Даставіць невялікія флаконы з ДНК нашмат прасцей, чым паўкары, поўныя жорсткіх дыскаў. Цяпер Інтэрнэт вельмі павольны, і калі вы адпраўляеце інфармацыю ў петабайтах, найбольшая прапускная здольнасць вы збіраецеся атрымаць FedEx. Насамрэч, фізічна перамяшчаць цвёрдыя дыскі кампаніі на паўпадставах, чым перасылаць Інтэрнэт ».

III. Перавагі для захоўвання ДНК: універсальнасць, шчыльнасць і кошт

Усё жыццё выкарыстоўвае ДНК (або нейкую форму нуклеінавых кіслот) для захоўвання. Эвалюцыя спынілася на адным з самых эфектыўных, доўгатэрміновых варыянтаў захоўвання дадзеных, пра які мы ведаем, так чаму б мы не скарысталіся ўласцівымі ёй уласцівасцямі для захавання тварэнняў чалавецтва?

ДНК у мільён разоў больш шчыльнай інфармацыі, чым флэш-назапашвальнікі, таму для яе захоўвання і транспартавання спатрэбіцца значна менш рэсурсаў, чым статус-кво, рэзка зніжаючы экалагічны след і кошт захоўвання дадзеных.

ДНК таксама значна танней і прасцей капіяваць - тое, што мы, верагодна, прымаем як належнае, бо нашы органы робяць гэта аўтаматычна незлічоная колькасць раз у дзень.

"Тысяча копій адной інфармацыі не каштуе ў тысячу разоў больш, чым на флэш-дысках ці жорсткіх дысках", - падкрэсліў Парк.

IV. Як працуе захоўванне ДНК

Tl; dr: Крок 1: пабудаваць сетку; Крок 2: Кадаваць сетку.

Раманавая метадалогія каталога абапіраецца на глыбокае разуменне спрадвечнага філасофскага пытання: што такое інфармацыя?

Што тычыцца лічбавай інфармацыі, дадзеныя - гэта толькі шэраг адзінак і нулёў. (ДНК мае, па меншай меры, чатыры адзінкі інфармацыі - A, T, G і C - якія можна звесці да нуляў і адзінак да таго часу, пакуль адзін захоўвае код. Яны і нулі захоўваюцца як ATGC.)

Вузкім месцам з'яўляецца высокі кошт раздрукоўкі нітак любой ДНК, якую вы хочаце, каля дзесяці цэнтаў за нуклеатыд сёння. Падумайце пра гэта, як надрукаваць пацеркі на нітцы, кожная пацерка каштуе капейкі. Да прыкладу, геном чалавека ў поўным аб'ёме каштаваў бы сёння 320 мільёнаў долараў!

Як абыйсці вузкае месца?

Новы метад каталога разбівае мноства вузкіх месцаў захоўвання і кошту, сінтэзуючы вялікія колькасці ўсяго некалькіх розных малекул ДНК і змешваючы іх у розных спалучэннях, каб стварыць велізарную колькасць розных малекул. Затым гэтыя малекулы выкарыстоўваюцца разам з іх інавацыйнымі метадамі кадавання, каб прадставіць доўгія серыі 1 і 0.

Груба кажучы, гэта тая самая эканомія тэхнікі, якую, скажам, выкарыстоўвае вытворца Legos. Зрабіць літую форму для новага вырабу вельмі дорага, таму дызайнеры Lego рэкамендуюць рабіць новыя наборы з ужо існуючых цаглін, якія можна зрабіць танна і проста.

Такім чынам, Lego вырабляе абмежаваную колькасць серыйных цаглін, а інфармацыя змяшчаецца ў інструкцыі па эксплуатацыі, якая ідзе разам і распавядае пра тыя асноўныя часткі, куды трэба ісці ў амаль бясконцы масіў набораў. Гэтыя інструкцыі па эксплуатацыі адпавядаюць схеме кадавання Каталога.

У той час як старыя метады разлічваюць на атрыманне нявызначанай колькасці новых цаглін кожны раз з нуля, каталог загадзя вызначае ўсе цагліны, якія будуць выкарыстоўвацца, і вырабляе з іх вялікую колькасць загадзя. Затым кожны раз, калі трэба захоўваць нешта новае, яны проста раздрукоўваюць новае кіраўніцтва.

Фотаздымак Зейн Торн

Напрыклад, для захоўвання аднаго тэрабайта дадзеных у ДНК, яны павінны выкарыстоўваць толькі некалькі сотняў "цаглін". Яны прынялі код жыцця і зрабілі яго больш эфектыўным.

"Не мае значэння, што гэта песня, альбо здымак, альбо відэа - пакуль яно можа быць адведзена да шэрагу нулёў і мы можам выкарыстоўваць той жа пратакол для гэтага", - растлумачыў Парк.

"Тое, што мы зрабілі па-рознаму ў Каталогу, - гэта тое, што мы пачалі пытацца, што гэта за інфармацыя і які лепшы спосаб прадставіць яе з дапамогай ДНК. Гэта было так, што мы не стрымлівалі сябе тым, як выкарыстоўваецца ДНК у прыродзе ".

V. Захоўванне ДНК у дзеянні

Хоць падыход Каталога можа здацца чымсьці настолькі тэхналагічна складаным, ён будзе абмяжоўвацца толькі сінтэтычнымі біёлагамі, вам не прыйдзецца ведаць, як паслядоваць ДНК, каб выкарыстоўваць сховішча ДНК, як і вам не трэба ведаць, як наладзіць сервер. ферма для выкарыстання хмары.

Тэарэтычна любы чалавек з закадаванай сінтэтычнай ДНК мог бы адправіць яго любому ліку пастаўшчыкоў, каб зрабіць паслядоўнасць ДНК для іх.

"Калі вы захоўваеце рэчы на ​​Amazon AWS, вы не хвалюецеся, ці будзе гэта рэзервовае капіраванне ў Blue-Rays, магнітнай стужкай ці жорсткімі дыскамі. Вам проста абыякава, што інфармацыя дзесьці бяспечная і вы зможаце яе атрымаць. Мы хочам, каб кліенты не хваляваліся, ці будзе гэта рэзервовае капіраванне ў ДНК ці не, проста што яны атрымліваюць сапраўды якасную паслугу і маюць душэўную раўнавагу, што ў яе ёсць некалькі звальненняў ".

Парк спадзяецца, што захоўванне дадзеных у ДНК стане такой жа паўсюднай практыкай, як і захаванне фота ў iCloud. Першае месца ў іх захоўванні будуць архіўныя дадзеныя: дадзеныя, якія звычайна доўга захоўваюцца ў бібліятэках мёртвых дрэў, і якія не ўзгадваюцца занадта часта. Архівісты, бібліятэкары, урады - кожны, хто займаецца вядзеннем дакладных гістарычных дакументаў, неадкладна выкарыстаў бы прадукт Каталогу.

У цяперашні час Бібліятэка Кангрэса плануе правесці сімпозіум па захаванні дадзеных. Парк будзе побач з прадстаўнікамі Інтэрнэт-архіва (стваральнікаў машыны Wayback). "Яны хочуць стаць Александрыйскай бібліятэкай для сучаснага свету і зрабіць веды даступнымі для ўсіх", - растлумачыў Парк пра Інтэрнэт-архіў.

Бібліятэка Кангрэса

"Яны захоўваюць шмат дадзеных у выніку. Яны хочуць захаваць гэтую бяспеку ў вечнасці, і мы хацелі б дадаць пласт бяспекі сваёй місіі з выкарыстаннем ДНК ".

VI. Будучыня інфармацыі: ДНК праз Сусвет

Дагэтуль каталожная ДНК даказала сваю здольнасць, кадзіраваўшы ў ДНК поўныя кнігі, напрыклад, Кіраўніцтва Аўтаспынам па Галактыцы Дугласа Адамса. У хуткім часе яны будуць пераводзіць цэлыя бібліятэкі кніг у малекулярныя коды. І аднойчы яны змогуць захоўваць усе звесткі, якія калі-небудзь ствараўся ў свеце, толькі ў пакоі, поўным ДНК.

Пасля таго, як яны здымуць гэта, далёка не ўявіць сабе распаўсюджваць дадзеныя Зямлі ва ўсіх кутках космасу, над якімі яны ўжо працуюць з місіяй Arch.

"Думаючы пра каланізацыю іншых планет, калі мы хочам адправіць увесь Інтэрнэт на Марс, каб чалавечая цывілізацыя працягвалася там, на самой справе няма іншага спосабу захоўваць і адпраўляць усю гэтую інфармацыю, акрамя ДНК", - сказаў мне Парк.

Тут, на Зямлі, Парк сказаў, што вельмі хацеў бы бачыць ДНК з кадаванай данымі, якая захоўваецца дзе-небудзь у будучыні, як Svalbard Global Seed Vault на востраве ў Нарвегіі.

Насенне, вядома, проста спосаб прыроды захоўваць у ДНК інфармацыю пра расліна. Размяшчэнне ўсіх чалавечых ведаў - усё, што мы ёсць, усё, што мы калі-небудзь рабілі, усё, што мы калі-небудзь рабілі - у адным сховішчы насення здаецца нейкім чынам прыдатным.

Калі мы хочам пераканацца, што будучыя пакаленні нясуць у сабе мудрасць свету наперад, каб яны таксама маглі стаяць на плячах гігантаў, мы павінны пераканацца, што яны не страцяць такой магчымасці адным імгненнем сонечнай ўспышкі. Трэба пераканацца, што мудрасць спакавана такім чынам, што вытрымае выпрабаванне часам. Каталог на шляху да рэалізацыі гэтага.