اخبار استارتاپی

سیستم عامل کامپیوتر و فیلم کوتاه ذخیره شده روی DNA

به زودی بشریت داده‌های بیشتری را نسبت به دیسک‌های سخت یا نوارهای مغناطیسی ایجاد خواهد کرد. این مشکلی بود که دانشمندان برای ذخیره سازی اطلاعات با آن مواجه بوده اند.

در یک تحقیق جدید، جمعی از محققان در دانشگاه کلمبیا و مرکز ژنوم نیویورک نشان می‌دهد که یک الگوریتم طراحی شده برای پخش ویدئو روی یک تلفن همراه می‌تواند تقریباً پتانسیل ذخیره‌سازی کامل DNA را از طریق فشرده‌سازی اطلاعات بیشتر و تبدیل آن به چهار نوکلئوتید پایه قفل‌گشایی می‌کند. آنها نشان می‌دهند که این فناوری به شدت قابل اعتماد است.

DNA یک ابزار ذخیره‌سازی ایده‌آل است زیرا به شدت فشرده بوده و می‌تواند صدها هزار سال باقی بماند به شرطی که در یک مکان خنک و خشک نگه‌داری شود.

یانیو ارلیچ، استاد علوم کامپیوتر در دانشکده مهندسی کلمبیا و یکی از اعضای NYGC، می‌گوید: ” DNAمانند نوار کاست و سی‌دی به مرور زمان از بین نمی‌رود، و منسوخ نیز نمی‌شود – اگر اینگونه باشد، ما با مشکلات بزرگتری مواجه بودیم.”

ارلیچ و همکارانش شش فایل را برای رمزگذاری، یا رایت کردن درون DNA انتخاب کردند: یک سیستم عامل کامپیوتری کامل، یک فیلم فرانسوی سال 1895 به نام “ورود قطار به لا سیوتات”، یک کارت هدیه آمازون به ارزش 50 دلار، یک ویروس کامپیوتری، یک صفحه پیونیر و یک تحقیق سال 1948 توسط نظریه‌پرداز اطلاعات، کلاد شانون.

سپس آنها فایل‌ها را در یک فایل اصلی فشرده کرده و داده‌ها را به دسته‌های کوتاه کد دوگانه که از صفر و یک تشکیل شده بودند، تقسیم کردند. با استفاده از یک الگوریتم به نام کدهای آبشاری، آنها به طور تصادفی این دسته‌ها را در قطرات بسته‌بندی کردند و صفر و یک‌ها را در هر قطره قرار دادند. این الگوریتم ترکیب‌های حروف شناخته شده برای ایجاد خطا را حذف کرد، و یک بارکد برای هر قطره اضافه کرد تا به مونتاژ دوباره فایل‌ها در زمان دیگر کمک کند.

در کل، آنها یک فهرست دیجیتال از 72.000 دسته DNA ساختند و آن را در یک فایل متنی به یک استارتاپ سنتز DNA در سان‌فرانسیسکو به نام Twist Bioscience ارسال کردند که در تبدیل داده‌های دیجیتال به داده‌های بیولوژیکی تخصص داشت. دو هفته بعد، آنها یک ویال حاوی مولکول‌های DNA دریافت کردند.

برای بازیابی فایل‌ها، آنها از فناوری دسته‌بندی مدرن برای خواندن دسته‌های DNA و سپس یک نرم افزار برای ترجمه کد ژنتیکی به کد دوگانه استفاده کردند. آنها فایل های خود را با خطاهای صفر بازیابی کردند.

به علاوه آنها نشان دادند که یک تعداد نامحدود از نسخه‌های فایل‌ها می‌تواند با شیوه رمزگذاری آنها و از طریق تکثیر نمونه DNA آنها با واکنش زنجیره پلیمری (PCR) ایجاد شود، و آن نسخه‌ها و حتی نسخه‌های آن نسخه‌ها و غیره را می‌توان بدون خطا بازیابی کرد.

در نهایت، محققان نشان می‌دهند که راهبرد رمزگذاری آنها 215 پتابایت داده را روی یک گرم DNA جمع‌ می‌کند – 100 برابر بیشتر از شیوه‌های منتشر شده توسط محققان ارشدی مانند جورج چرچ از هاروارد، و نیک گلدمن و اوان بیرنی از موسسه اروپایی بیواینفورماتیکس. ارلیچ می‌گوید: “ما معقتدیم که این دستگاه ذخیره‌سازی داده بالاترین میزان فشردگی و تراکم را دارد.”

ظرفیت ذخیره‌سازی داده DNA به طور نظری به دو رقم دودویی برای هر نوکلئوتید محدود می‌شود، اما محدودیت‌های بیولوژیکی DNA و نیاز به گنجاندن اطلاعات تکراری برای مونتاژ دوباره و خواندن جزئیات در زمان دیگر، ظرفیت آن را تا 1.8 رقم دودویی به ازای هر نوکلئوتید کاهش می‌دهد.

امتیاز بدهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *