Microsoft: ένα βήμα παρακάτω στην αποθήκευση δεδομένων σε DNA

iGuRu.gr > Microsoft: ένα βήμα παρακάτω στην αποθήκευση δεδομένων σε DNA

2 min read

Η προοπτική αποθήκευσης τεράστιων ποσοτήτων δεδομένων σε DNA έρχεται πιο κοντά στην πραγματικότητα χάρη σε μια νέα τεχνική ανάκτησης δεδομένων.

Η Microsoft δείχνει ενδιαφέρεται για το συνθετικό DNΑ. Η εταιρεία σκέφτεται να το χρησιμοποιήσει μελλοντικά σαν ένα μέσο αποθήκευσης που θα μπορούσε να λύσει την ανάγκη του κόσμου για συνεχώς αυξανόμενη αποθήκευση δεδομένων.

Προηγούμενες έρευνες έδειξαν ότι σε λίγα μόνο γραμμάρια DNA μπορούν να αποθηκεύσουν ένα exabyte δεδομένων και να το διατηρήσουν ως έχει για 2.000 χρόνια.

Το μειονέκτημα είναι ότι η μέθοδος είναι αρκετά δαπανηρή και εξαιρετικά αργή. Η γραφή δεδομένων στο DNA, συμπεριλαμβάνει τη μετατροπή των 0 και του 1 σε μόρια του DNΑ (αδενίνη, θυμίνη, κυτοσίνη και γουανίνη), ενώ η ανάκτηση δεδομένων από το DNΑ θα πρέπει να συμπεριλαμβάνει την αποκωδικοποίηση των αρχείων σε 0 και 1.

Η εύρεση και η ανάκτηση των συγκεκριμένων αρχείων που είναι αποθηκευμένα στο DNA είναι επίσης μια πολύ μεγάλη πρόκληση.

Όπως εξηγούν οι επιστήμονες από το Microsoft Research και του Πανεπιστημίου της Washington, χωρίς μια τυχαία πρόσβαση ή κάποιο δυνατότητα επιλεκτικής ανάκτησης αρχείων από το αποθηκευμένο DNA, θα χρειάζεται η αποκωδικοποίηση ολόκληρου του συνόλου δεδομένων που συμπεριλαμβάνει για την ανεύρεση των αρχείων που επιθυμούμε. Η δημιουργία μιας τυχαίας πρόσβασης θα μείωνε την ποσότητα των διεργασιών που πρέπει να γίνουν για κάθε αναζήτηση-ανεύρεση.

Για να επιτευχθεί λοιπόν κάποια τυχαία πρόσβαση στο DNA, δημιούργησαν μια βιβλιοθήκη “εκκινητών” που συνδέεται με κάθε αλληλουχία του DNΑ. Οι εκκινητές, μαζί με μια αλυσωτή αντίδραση πολυμεράσης (PCR), χρησιμοποιούνται σαν στόχοι για την επιλογή των επιθυμητών αποσπασμάτων του DNA μέσω μιας τυχαίας πρόσβασης.

“Πριν από τη σύνθεση των δεδομένων από ένα αρχείο στο DNA, οι ερευνητές πρόσθεσαν στα δύο άκρα κάθε αλληλουχίας DΝΑ στόχους εκκινητών PCR από τη βιβλιοθήκη εκκινητών”, αναφέρει το Πανεπιστήμιο της Washington.

“Στη συνέχεια, χρησιμοποίησαν αυτούς τους εκκινητές για να επιλέξουν το επιθυμητό σημείο μέσω κάποιας τυχαίας πρόσβασης και χρησιμοποίησαν έναν νέο αλγόριθμο σχεδιασμένο για την αποδοτικότερη αποκωδικοποίηση και αποκατάσταση των δεδομένων στην αρχική τους ψηφιακή κατάσταση”.

Οι ερευνητές ανέπτυξαν επίσης έναν αλγόριθμο για την αποδοτικότερη αποκωδικοποίηση και αποκατάσταση των δεδομένων. Ο ερευνητής της Microsoft Sergey Yekhanin δήλωσε ότι οι νέοι αλγόριθμοι είναι πιο ανεκτικοί σε σφάλματα κατά τη γραφή και την ανάγνωση αλληλουχιών DNA, γεγονός που μειώνει τις διεργασίες και την επεξεργασία που απαιτείται για την ανάκτηση πληροφοριών.

Αν και δεν είναι η πρώτη φορά που έχει επιτευχθεί μια τυχαία πρόσβαση στο DNA, είναι η πρώτη φορά που έγινε σε τέτοια κλίμακα, σύμφωνα με τους ερευνητές.

Οι ερευνητές κωδικοποίησαν σε συνθετικό DNA ένα αρχείο δεδομένων 200MB που περειείχε 35 των 29kB μέχρι 44MB. Τα αρχεία περιείχαν βίντεο, ήχο, εικόνες και κείμενο υψηλής ευκρίνειας.

Μετά την κυκλοφορία της μελέτης που περιγράφει την τεχνική, κωδικοποίησαν και ανέκτησαν αρχεία 400MB δεδομένων στο DNΑ.

Οι ερευνητές πιστεύουν ότι η προσέγγιση που έχουν χρησιμοποιήσει για την τυχαία πρόσβαση θα κλιμακωθεί σε μεγάλες δεξαμενές DNΑ που περιέχουν αρκετά terabyte η κάθε μία.