Το ανθρώπινο γονιδίωμα σε bit και byte
Τι νομίζετε ότι περιέχει περισσότερες πληροφορίες, το DNA που συνθέτει τον οργανισμό μας ή όλα τα ψηφιακά δεδομένα που υπάρχουν στη Γη; Το ερώτημα δεν τέθηκε από εμάς αλλά από τον Ντέρεκ Μίλερ, φυσικό ο οποίος έχει γίνει διάσημος ανά την υφήλιο εκλαϊκεύοντας επιστημονικά θέματα μέσω του διαδικτυακού καναλιού Veritasium που έχει δημιουργήσει στο YouTube. Ο κ. Μίλερ δεν θέτει απλώς τα ερωτήματα, φροντίζει επίσης να τα απαντά –και αυτό ακριβώς έσπευσε να κάνει και σε αυτή την περίπτωση. Όπως υπολόγισε εφαρμόζοντας τη θεωρία της πληροφορίας στο ανθρώπινο γενετικό υλικό, τα δεδομένα που απαιτούνται για να συνθέσουν τον καθένα από εμάς είναι μόλις… 1,5 GB – ωχριούν δηλαδή μπροστά στην ψηφιακή κληρονομιά του πλανήτη αφού μπορούν να χωρέσουν άνετα σε ένα απλό DVD.
Δυαδικό ζωτικό σύστημα
Προκειμένου να ποσοτικοποιήσει τα ανθρώπινα γενετικά δεδομένα ο κ. Μίλερ «διάβασε» τα γράμματα του DNA με οδηγό τη θεωρία των πληροφοριών και το δυαδικό σύστημα. Όπως εξηγεί στο σχετικό βίντεό του, η μικρότερη ποσότητα πληροφορίας που μπορούμε να έχουμε είναι ένα απλό «ναι» ή «όχι» _ ή αντίστοιχα «κορώνα» ή «γράμματα» κ.ο.κ. – τα οποία στο δυαδικό σύστημα μπορούν να «μεταφραστούν» αντίστοιχα σε 1 και 0. Το κάθε ψηφίο του δυαδικού συστήματος αντιστοιχεί σε 1 bit πληροφοριών. Tο 1963, «ψηφιοποιώντας» ολόκληρο το αγγλικό αλφάβητο, με τους πεζούς και κεφαλαίους χαρακτήρες συν τα σημεία στίξης, στον Αμερικανικό Πρότυπο Κώδικα για την Ανταλλαγή Πληροφοριών – American Standard Code for Information Interchange, πιο γνωστός ως ASCII - οι ειδικοί είδαν ότι για να κωδικοποιηθεί χρειάζονται 7 bits. Οι ηλεκτρονικοί υπολογιστές όμως για να λειτουργήσουν χρειάζονται ως βάση έναν ζυγό αριθμο, γι’ αυτό και χρησιμοποιούν ως υπολογιστική μονάδα τα 8 bits, τα οποία και ονομάστηκαν 1 byte (η επιλογή του «y» όπως τονίζει ο επιστήμονας είναι εσκεμμένη προκειμένου να μην υπάρχουν «παρεξηγήσεις» ανάμεσα στις δυο μονάδες).
Ο γενετικός κώδικάς μας είναι «γραμμένος» σε μια αλληλουχία τεσσάρων χημικών βάσεων οι οποίες αναπαρίστανται με τέσσερα γράμματα –A, T, G και C. Το καθένα από αυτά μπορεί να κωδικοποιηθεί με 2 bits πληροφοριών– 00. 10. 11. 01. Αν πολλαπλασιάσουμε αυτόν τον αριθμό επί 6 δισεκατομμύρια (3 δισ. ζεύγη βάσεων) που είναι ο αριθμός των γραμμάτων που περιέχει το γονιδίωμά μας και στη συνέχεια τον διαιρέσουμε διά 8 για να εξαγάγουμε τον αριθμό των bytes ο κ. Μίλερ υπολόγισε ότι ολόκληρος ο γενετικός μας κώδικας περιέχει μόλις 1,5 GB. Όπως επισημαίνει, αυτός ο όγκος πληροφοριών μπορεί να αποθηκευθεί σε ένα κοινό DVD (και να περισσέψει και χώρος) ενώ αντιστοιχεί περίπου σε 1.204 ηλεκτρονικά βιβλία (αν υπολογίσουμε ένα βιβλίο στο 1,4 MB) ή σε 512 ψηφιακές φωτογραφίες (αν υπολογίσουμε την κάθε φωτογραφία στα 3 MB).
Στην πραγματικότητα όμως η ποσότητα της πληροφορίας είναι μικρότερη από 1,5 Gigabyte, αφού οι 6 δισεκατομμύρια βάσεις του DNA συνδέονται σε ζευγάρια με συγκεκριμένο τρόπο, έτσι ώστε αν κανείς γνωρίζει τη μία βάση του ζεύγους γνωρίζει και την άλλη. Αυτό σημαίνει ότι η γενετική πληροφορία είναι το μισό, περίπου 750 Megabyte.
Δυαδικό ζωτικό σύστημα
Προκειμένου να ποσοτικοποιήσει τα ανθρώπινα γενετικά δεδομένα ο κ. Μίλερ «διάβασε» τα γράμματα του DNA με οδηγό τη θεωρία των πληροφοριών και το δυαδικό σύστημα. Όπως εξηγεί στο σχετικό βίντεό του, η μικρότερη ποσότητα πληροφορίας που μπορούμε να έχουμε είναι ένα απλό «ναι» ή «όχι» _ ή αντίστοιχα «κορώνα» ή «γράμματα» κ.ο.κ. – τα οποία στο δυαδικό σύστημα μπορούν να «μεταφραστούν» αντίστοιχα σε 1 και 0. Το κάθε ψηφίο του δυαδικού συστήματος αντιστοιχεί σε 1 bit πληροφοριών. Tο 1963, «ψηφιοποιώντας» ολόκληρο το αγγλικό αλφάβητο, με τους πεζούς και κεφαλαίους χαρακτήρες συν τα σημεία στίξης, στον Αμερικανικό Πρότυπο Κώδικα για την Ανταλλαγή Πληροφοριών – American Standard Code for Information Interchange, πιο γνωστός ως ASCII - οι ειδικοί είδαν ότι για να κωδικοποιηθεί χρειάζονται 7 bits. Οι ηλεκτρονικοί υπολογιστές όμως για να λειτουργήσουν χρειάζονται ως βάση έναν ζυγό αριθμο, γι’ αυτό και χρησιμοποιούν ως υπολογιστική μονάδα τα 8 bits, τα οποία και ονομάστηκαν 1 byte (η επιλογή του «y» όπως τονίζει ο επιστήμονας είναι εσκεμμένη προκειμένου να μην υπάρχουν «παρεξηγήσεις» ανάμεσα στις δυο μονάδες).
Ο γενετικός κώδικάς μας είναι «γραμμένος» σε μια αλληλουχία τεσσάρων χημικών βάσεων οι οποίες αναπαρίστανται με τέσσερα γράμματα –A, T, G και C. Το καθένα από αυτά μπορεί να κωδικοποιηθεί με 2 bits πληροφοριών– 00. 10. 11. 01. Αν πολλαπλασιάσουμε αυτόν τον αριθμό επί 6 δισεκατομμύρια (3 δισ. ζεύγη βάσεων) που είναι ο αριθμός των γραμμάτων που περιέχει το γονιδίωμά μας και στη συνέχεια τον διαιρέσουμε διά 8 για να εξαγάγουμε τον αριθμό των bytes ο κ. Μίλερ υπολόγισε ότι ολόκληρος ο γενετικός μας κώδικας περιέχει μόλις 1,5 GB. Όπως επισημαίνει, αυτός ο όγκος πληροφοριών μπορεί να αποθηκευθεί σε ένα κοινό DVD (και να περισσέψει και χώρος) ενώ αντιστοιχεί περίπου σε 1.204 ηλεκτρονικά βιβλία (αν υπολογίσουμε ένα βιβλίο στο 1,4 MB) ή σε 512 ψηφιακές φωτογραφίες (αν υπολογίσουμε την κάθε φωτογραφία στα 3 MB).
Στην πραγματικότητα όμως η ποσότητα της πληροφορίας είναι μικρότερη από 1,5 Gigabyte, αφού οι 6 δισεκατομμύρια βάσεις του DNA συνδέονται σε ζευγάρια με συγκεκριμένο τρόπο, έτσι ώστε αν κανείς γνωρίζει τη μία βάση του ζεύγους γνωρίζει και την άλλη. Αυτό σημαίνει ότι η γενετική πληροφορία είναι το μισό, περίπου 750 Megabyte.
Η μοναδικότητά μας σε μια δισκέτα
Μετά τον υπολογισμό του όγκου δεδομένων του γενετικού μας κώδικα ο κ. Μίλερ περνάει στην «ποσοτικοποίηση» των δεδομένων που περιλαμβάνει ολόκληρος ο οργανισμός μας. Κάθε κύτταρό μας περιέχει ένα πλήρες αντίγραφο του γενετικού μας κώδικα (δηλ. 1,5 GB πληροφοριών) και ολόκληρο το σώμα μας αποτελείται από 40 τρισεκατομμύρια κύτταρα: το γινόμενο ισούται με 60 zettabytes δεδομένων, γεγονός το οποίο σημαίνει ότι «τρέχουμε» πληροφορίες 60.000.000.000.000.000.000.000 bytes (όγκος δεδομένων μεγαλύτερος από τα 40 zetabytes που εκτιμάται ότι θα φθάσουν όλες οι ψηφιακές πληροφορίες του πλανήτη το έτος 2020).
Ολος αυτός ο όγκος δεδομένων δεν είναι όμως «προσωπικός». Το 99,9% των γενετικών πληροφοριών είναι κοινό σε όλους τους ανθρώπους, πράγμα το οποίο σημαίνει ότι αυτό που καθιστά μοναδικό τον καθένα από εμάς συρρικνώνεται δραματικά: «πέφτει» αρκετά κάτω από το 1 MB και θα μπορούσε να αποθηκευθεί σε μια από τις παλιές δισκέτες που σήμερα οδεύουν προς το… μουσείο.
Μετά τον υπολογισμό του όγκου δεδομένων του γενετικού μας κώδικα ο κ. Μίλερ περνάει στην «ποσοτικοποίηση» των δεδομένων που περιλαμβάνει ολόκληρος ο οργανισμός μας. Κάθε κύτταρό μας περιέχει ένα πλήρες αντίγραφο του γενετικού μας κώδικα (δηλ. 1,5 GB πληροφοριών) και ολόκληρο το σώμα μας αποτελείται από 40 τρισεκατομμύρια κύτταρα: το γινόμενο ισούται με 60 zettabytes δεδομένων, γεγονός το οποίο σημαίνει ότι «τρέχουμε» πληροφορίες 60.000.000.000.000.000.000.000 bytes (όγκος δεδομένων μεγαλύτερος από τα 40 zetabytes που εκτιμάται ότι θα φθάσουν όλες οι ψηφιακές πληροφορίες του πλανήτη το έτος 2020).
Ολος αυτός ο όγκος δεδομένων δεν είναι όμως «προσωπικός». Το 99,9% των γενετικών πληροφοριών είναι κοινό σε όλους τους ανθρώπους, πράγμα το οποίο σημαίνει ότι αυτό που καθιστά μοναδικό τον καθένα από εμάς συρρικνώνεται δραματικά: «πέφτει» αρκετά κάτω από το 1 MB και θα μπορούσε να αποθηκευθεί σε μια από τις παλιές δισκέτες που σήμερα οδεύουν προς το… μουσείο.
Πηγή: in.gr
Σχόλια
Δημοσίευση σχολίου