به زودی بشریت دادههای بیشتری را نسبت به دیسکهای سخت یا نوارهای مغناطیسی ایجاد خواهد کرد. این مشکلی بود که دانشمندان برای ذخیره سازی اطلاعات با آن مواجه بوده اند.
در یک تحقیق جدید، جمعی از محققان در دانشگاه کلمبیا و مرکز ژنوم نیویورک نشان میدهد که یک الگوریتم طراحی شده برای پخش ویدئو روی یک تلفن همراه میتواند تقریباً پتانسیل ذخیرهسازی کامل DNA را از طریق فشردهسازی اطلاعات بیشتر و تبدیل آن به چهار نوکلئوتید پایه قفلگشایی میکند. آنها نشان میدهند که این فناوری به شدت قابل اعتماد است.
DNA یک ابزار ذخیرهسازی ایدهآل است زیرا به شدت فشرده بوده و میتواند صدها هزار سال باقی بماند به شرطی که در یک مکان خنک و خشک نگهداری شود.
یانیو ارلیچ، استاد علوم کامپیوتر در دانشکده مهندسی کلمبیا و یکی از اعضای NYGC، میگوید: ” DNAمانند نوار کاست و سیدی به مرور زمان از بین نمیرود، و منسوخ نیز نمیشود – اگر اینگونه باشد، ما با مشکلات بزرگتری مواجه بودیم.”
ارلیچ و همکارانش شش فایل را برای رمزگذاری، یا رایت کردن درون DNA انتخاب کردند: یک سیستم عامل کامپیوتری کامل، یک فیلم فرانسوی سال 1895 به نام “ورود قطار به لا سیوتات”، یک کارت هدیه آمازون به ارزش 50 دلار، یک ویروس کامپیوتری، یک صفحه پیونیر و یک تحقیق سال 1948 توسط نظریهپرداز اطلاعات، کلاد شانون.
سپس آنها فایلها را در یک فایل اصلی فشرده کرده و دادهها را به دستههای کوتاه کد دوگانه که از صفر و یک تشکیل شده بودند، تقسیم کردند. با استفاده از یک الگوریتم به نام کدهای آبشاری، آنها به طور تصادفی این دستهها را در قطرات بستهبندی کردند و صفر و یکها را در هر قطره قرار دادند. این الگوریتم ترکیبهای حروف شناخته شده برای ایجاد خطا را حذف کرد، و یک بارکد برای هر قطره اضافه کرد تا به مونتاژ دوباره فایلها در زمان دیگر کمک کند.
در کل، آنها یک فهرست دیجیتال از 72.000 دسته DNA ساختند و آن را در یک فایل متنی به یک استارتاپ سنتز DNA در سانفرانسیسکو به نام Twist Bioscience ارسال کردند که در تبدیل دادههای دیجیتال به دادههای بیولوژیکی تخصص داشت. دو هفته بعد، آنها یک ویال حاوی مولکولهای DNA دریافت کردند.
برای بازیابی فایلها، آنها از فناوری دستهبندی مدرن برای خواندن دستههای DNA و سپس یک نرم افزار برای ترجمه کد ژنتیکی به کد دوگانه استفاده کردند. آنها فایل های خود را با خطاهای صفر بازیابی کردند.
به علاوه آنها نشان دادند که یک تعداد نامحدود از نسخههای فایلها میتواند با شیوه رمزگذاری آنها و از طریق تکثیر نمونه DNA آنها با واکنش زنجیره پلیمری (PCR) ایجاد شود، و آن نسخهها و حتی نسخههای آن نسخهها و غیره را میتوان بدون خطا بازیابی کرد.
در نهایت، محققان نشان میدهند که راهبرد رمزگذاری آنها 215 پتابایت داده را روی یک گرم DNA جمع میکند – 100 برابر بیشتر از شیوههای منتشر شده توسط محققان ارشدی مانند جورج چرچ از هاروارد، و نیک گلدمن و اوان بیرنی از موسسه اروپایی بیواینفورماتیکس. ارلیچ میگوید: “ما معقتدیم که این دستگاه ذخیرهسازی داده بالاترین میزان فشردگی و تراکم را دارد.”
ظرفیت ذخیرهسازی داده DNA به طور نظری به دو رقم دودویی برای هر نوکلئوتید محدود میشود، اما محدودیتهای بیولوژیکی DNA و نیاز به گنجاندن اطلاعات تکراری برای مونتاژ دوباره و خواندن جزئیات در زمان دیگر، ظرفیت آن را تا 1.8 رقم دودویی به ازای هر نوکلئوتید کاهش میدهد.