۱۸ تیر ۱۳۹۸

فناوری‌های نوین – شماره چهار


ذخیره داده‌ها بر پایه ساختار دی‌اِن‌اِی


در سال ۲۰۱۹ محققان دانشگاه واشنگتن و شرکت مایکروسافت با ارتقاء زیرساختِ ذخیره‌سازیِ داده‌ها بار دیگر تاریخ‌ساز شدند به گفته دکتر یانیو اِرلِیک [1] همانگونه که بدن انسان آن را به اثبات رسانده است، دی‌اِن‌اِی مصنوعی [2] وسیله‌ای مناسب و قابل اعتماد جهت ذخیره‌سازی داده‌های انبوه در فضایی بسیار محدود همراه با پایداری طولانی مدت بشمار می‌رود.س

قابلیت بالقوه دی‌اِن‌اِی شرکت‌ها و مراکز تحقیقاتی بزرگ از جمله دارپا یا آژانس پروژه‌های تحقیقاتی پیشرفته دفاعی آمریکا را مشتاق به سرمایه‌گذاری در پروژه ذخیره داده‌ها بر پایه ساختار دی‌اِن‌اِی کرده است. طبعاً در صورت موفقیت کامل این طرح، تحول بارزی در زیرساخت ذخیره‌سازی اطلاعات در جهان روی خواهد داد.س
در حال حاضر آرشیوهای اطلاعاتی بر روی نوارهای مغناطیسی و تراشه‌های سیلیکونی ذخیره می‌گردند که در مقایسه با قیمت تمام شدۀ روش ذخیره‌‌سازی بر روی دی‌ان‌ای مصنوعی تجهیزات فعلی ارزان‌ترین وسایل جهت ذخیره داده‌ها می‌باشند.س

پیش‌بینی می‌شود که تا سال ۲۰۲۵ حجم اطلاعات تولید شده توسط انسان‌ها به ۱۶۰ زِتابایت [3] برسد ولی زیرساخت‌های فعلیِ ذخیره‌‌سازیِ داده‌ها تنها می‌توانند یک بخش کوچکی از اطلاعات آینده را اداره کنند از سوی دیگر با افزایش تصاعدی اطلاعات، فضای مورد نیاز، جهت نگهداری نوارهای مغناطیسی نیز در حال افزایش است بعلاوه این اطلاعات پس از زمان نسبتاً کوتاهی از بین خواهند رفت بدین منظور همواره باید آنها را قبل از نابودی، بار دیگر بر روی نوار مغناطیسی دیگری بازنویسی یا کپی کرد.س
به نظر می‌رسد که کدگذاری بر روی مولکول‌های بسیار کوچک دی‌اِن‌اِی مصنوعی مشکل انبار کردن نوارهای مغناطیسی را برطرف خواهد کرد تنها ۱۰ تُن دی‌اِن‌اِی مصنوعی قابلیت ذخیره تمامی داده‌های موجود بر روی کره زمین را دارد در این صورت فقط به یک تریلی ۱۰ تُنی برای انبار کردن آنها نیاز داریم همچنین دی‌اِن‌اِی دارای طول عمر بسیار زیادی است قدیمی‌ترین دی‌اِن‌اِی انسانی که یافت شده قدمتی چهارصدهزار ساله دارد که نشانه پایداری طولانی مدت آن می‌باشد.س

در حال حاضر متداول‌ترین تجهیزات ذخیره‌سازی داده‌ها عبارتند از دیسک‌های سخت، دیسک‌های نوری و حافظه‌های فلش که با تغییر ماهیت خاصیت مغناطیسی، الکتریکی و نوری مواد، داده‌ها را در خود ذخیره می‌کنند ذخیره داده‌ها بر روی دی‌اِن‌اِی مصنوعی مانند روش‌های مرسوم ولی با فرایندی متفاوت صورت می‌گیرد. واحد‌های سازندۀ مارپیچ دوگانۀ مولکول دی‌اِن‌اِی برخلاف آنچه که به نظر می‌رسند ساختار ساده‌ای دارند برای ذخیره‌سازی اطلاعات، در واقع واحدهای سازنده رشته دی‌اِن‌اِی یعنی اِی، جی ، سی و تی جایگزین صفر و یک یا همان کدهای باینری می‌شوند. به عبارت دیگر ابتدا واحدهای سازنده کد گذاری شده سپس توسط یک دستگاه توالی اطلاعات بازیافت و بازخوانی می‌شوند.س
بعنوان نمونه یک تصویر دیجیتال، شامل مجموعه بزرگی از صفر و یک می‌باشد. فرض کنید که 8 بیت ابتدایی این تصویر شامل کد باینری " ۰۰۰۱۱۰۱۱" باشد. ابتدا بیت‌ها به کدهای دوتایی دسته‌بندی شده سپس سی،جی، تی و اِی جایگزین این زوج‌های باینری می‌شوند برای مثال "اِی" جایگزین "۰۰" و "تی" جایگزین "۱۱" و الی آخر، این در واقع ترتیبی است که رشته‌های مارپیچی دی‌اِن‌اِی به این صورت مرتب می‌گردند. س

فایل‌های کامپیوتری می‌توانند به اندازه یک تِرابایت [4] یا بیشتر حجم داشته باشند که برای ذخیره‌سازی آنها به رشته‌های بلندِ دی‌اِن‌اِی نیاز داریم ولی ساخت آنها بسیار مشکل‌ است به همین دلیل باید داده‌ها را به قطعات کوچکتری تقسیم کرد و به هر یک از این قطعات شناسه‌ایی را افزود تا هنگام بازخوانی داده‌ها بتوان هر یک از رشته‌ها را در مکان صحیح خود قرار داد پس از تعیین ترتیب و مکان حروف، رشته‌های مولکول دی‌اِن‌اِی به کمک یک فرایند شیمیایی سخت می‌شوند سپس جهت محافظت در مقابل رطوبت و نور در یک مخزن‌ مخصوص و خنک قرار می‌گیرند.س

بمنظور بازخوانی داده‌های ذخیره شده مانند آنچه که جهت تجزیه و تحلیل اطلاعات و دستورالعمل‌های ژنتیکی بر روی دی‌اِن‌اِی انجام می‌گیرد به دستگاه توالی نیازمندیم. این دستگاه در واقع واحدهای سازنده کدگذاری شده را تشخیص داده سپس مرتب می‌کند و در انتها آنها را به کدهای باینریِ صفر و یک تبدیل می‌نماید.س
متاسفانه در حال حاضر برای دسترسی به اطلاعات مشخص، باید تمامی مخزن محتوای دی‌اِن‌اِی را بازخوانی کرد. این مانند آن است که برای دسترسی به یک پیام الکترونیکی تمامی هارددیسک را جستجو کنیم البته تحقیقاتی در حوزه علم بیوشیمی در جریان است تا به کمک شناسه‌هایی ویژه این مشکل برطرف گردد.س

معضل دیگر سنتز، تجزیه و ترکیب دی‌اِن‌اِی است که همواره بطور کامل صورت نمی‌پذیرد و در برخی از موارد با بی‌نظمی در این زمینه روبرو می‌شویم همه مولکول‌ها قادر به انجام این عمل نبوده و در برخی موارد، بیت‌ها تکرار می‌شوند بمنظور کاهش ضریب خطا، محققان با الهام از جدول بازی سودوکو، الگوریتمی را طراحی کردند که در صورت از دست دادن بازی با سرنخ‌های موجود ‌قادر به حل جدول باشند به کمک این روش می‌توان یک پِتا‌بایت [5] اطلاعات را بر روی یک گرم دی‌اِن‌اِی ذخیره و آن را بطور کامل بازخوانی کرد.س

حال باید به سرعت بسیار پایین نوشتن اطلاعات دراین روش بعنوان آخرین معضل اشاره کنیم. سرعت ذخیره داده‌ها برروی دی‌اِن‌اِی مصنوعی حدود چندصد بایت در ثانیه است در حالیکه سرعت ذخیره‌ اطلاعات در سخت‌افزار‌های امروزی حدود چند صد میلیون بایت در ثانیه است بدین‌ترتیب تصویری که تنها در کمتر از یک ثانیه در گوشی هوشمند ذخیره می‌شود بر روی دی‌اِن‌اِی طی چندین ساعت ذخیره خواهد شد.س

ماه اکتبر ۲۰۱۷ محققان دانشگاه واشنگتن و شرکت مایکروسافت با همکاری شرکت توئیست بیوساینس [6] توانستن دو قطعه موسیقی را برای اولین بار بدون تقلیل کیفی بر روی یک رشته دی‌اِن‌اِی مصنوعی با موفقیت به صورت دستی در آزمایشگاه ذخیره‌سازی، بازیافت و بازخوانی کنند، اما اخیراً محققان شرکت مایکروسافت و دانشگاه واشنگتن از طرح اولیه دستگاهی رونمایی کردند که نشان می‌دهد می‌توان اطلاعات را به شکل خودکار روی دی‌ان‌ای مصنوعی ذخیره کرد این گروه پژوهشی توانست کلمه " هِلو" [7] به معنای سلام را بدون دخالت انسان ذخیره و بازیابی کند.س
حال، گام بعدی قابلیت تجاری‌سازی این روش جهت حفظ داده‌ها در سونامی اطلاعات آینده خواهد بود.س

بیل گیتش [8] باور دارد که دی‌اِن‌اِی مانند یک برنامه کامپیوتری است، اما بسیار بسیار پیشرفته تر از هر نرم افزاری که تاکنون ایجاد شده است.س


تحقیق و پژوهش از راز شیدایی



منابع:س
• WITH A “HELLO” MICROSOFT AND UW DEMONSTRATE FIRST FULLY AUTOMATED DNA DATA STORGE.
  ( BY JENNIFER LANGSTON-MARCH 21, 2019)
• THE RISE OF DNA DATA STORAGE (JUNE 26, 2018)
• THE FINANCIAL TIMES (MARCH 2018)
...........................................................................................
کد مقاله در آرشیو فصلنامه:س
Tkh,v ihd k,dk-alhvi +ihv-bodvi nhni ih fv #hdi shojhv nfd hk hd


[1] Dr. YANIV ERLICH
[2] SYNTHETIC DNA
[3] ZETTABYTE: 1ZB = 1021 BYTES
[4] TERABYTE: 1TB = 1012 BYTES

پانوشت:س
[5] PETABYTE: 1PB = 1015 BYTES
[6] TWIST BIOSCIENCE
[7] HELLO
[8] BILL GATES

هیچ نظری موجود نیست:

ارسال یک نظر