Στην τροχιά του e-science

1Πριν από λίγες ημέρες το Ευρωπαϊκό Κέντρο Σωματιδιακής Φυσικής CERN γιόρτασε τη λειτουργία του GRID, ενός συστήματος κατανεμημένης υπολογιστικής ισχύος χάρη στο οποίο αναμένεται να γίνει εφικτή η ανάλυση των δεδομένων του πειράματος για την εξαγωγή των απαραίτητων επιστημονικών συμπερασμάτων.

Το Grid είναι σίγουρα η δεύτερη μεγαλύτερη είδηση του CERN αυτό τον καιρό, αλλά είναι η πρώτη στον κόσμο των υπολογιστών. Οπως πριν από τριάντα χρόνια ο Tim Berners Lee, ερευνητής τότε του CERN, δημιούργησε τον παγκόσμιο ιστό ο οποίος άλλαξε τη ζωή μας, έτσι και σήμερα οι επιστήμονες πιστεύουν ότι η φιλοσοφία των κατανεμημένων δικτύων υπολογιστών πρόκειται να φέρει άλλη μια επανάσταση στον κόσμο της πληροφορικής και στη ζωή μας.

Κι αν δεν το κάνει άμεσα στη ζωή μας, το κάνει όμως στην ίδια την επιστήμη. Πριν από λίγους μήνες, το περιοδικό wired διεκήρυττε την έναρξη της εποχής του Petabyte Science. «Ολα τα επιστημονικά μοντέλα είναι λάθος, αλλά μερικά μας είναι χρήσιμα. Τα μεγαμπάιτ δεδομένων αποθηκεύονταν σε σκληρούς δίσκους και τα τεραμπάιτ σε διατάξεις δίσκων. Τα πεταμπάιτ δεδομένων που παράγονται σήμερα όμως αποθηκεύονται σε σύννεφα υπολογιστών», έγραφε ο Chris Anderson, δείχνοντας ότι είναι η τεράστια αύξηση του όγκου δεδομένων που μαζί με την εξέλιξη των υπολογιστών μας οδηγεί σε ένα νέο είδος επιστήμης.

Ανοιγμα υποδομών

Οπότε, καλά τα επιστημονικά μοντέλα, όπως για παράδειγμα τα μοντέλα του Νεύτωνα που κατατρίφθηκαν αργότερα από την κβαντομηχανική (που μπορεί με τη σειρά της να αντικατασταθεί κάποια στιγμή από μια επόμενη θεωρία), όμως χάρη στους υπολογιστές μπορούμε να τα παράγουμε χωρίς καν να καταλαβαίνουμε τι ακριβώς σημαίνουν. Το μόνο που χρειάζεται πραγματικά να καταλαβαίνουμε είναι τα εφαρμοσμένα μαθηματικά, που θα παράγουν τις λύσεις που χρειαζόμαστε.

Το κείμενο αυτό συνάντησε σφοδρές αντιδράσεις στον επιστημονικό κόσμο, ο οποίος εξακολουθεί να πιστεύει ότι η παραγωγή επιστημονικής γνώσης δεν μπορεί να μετατραπεί σε μια μηχανική μαθηματική διαδικασία, όμως το σκηνικό στο οποίο αναφέρεται δεν αλλάζει.

Oλο και μεγαλύτερα πειράματα απαιτούν περισσότερη διεθνή συνεργασία και άνοιγμα των υποδομών και των παραγόμενων δεδομένων, κάτι που μπορεί να επιτευχθεί μόνο με τη βοήθεια των υπολογιστών. Με δυο λόγια, είμαστε πια στην εποχή του e-science.

«e-science είναι το σύνολο των υποδομών που απαιτούνται για να τρέξουν υπολογιστικά απαιτητικές εφαρμογές, μεγάλος όγκος δεδομένων κ. ο. κ. Η έρευνα γίνεται χρησιμοποιώντας πλέον πόρους που δεν μπορεί να βρίσκονται συγκεντρωμένοι σε ένα εργαστήριο. Υπάρχει ανάγκη για διεπιστημονική συνεργασία και μοίρασμα δεδομένων σε πολλούς αποδέκτες, φορείς και εργαστήρια που μπορεί να βρίσκονται σε όλο τον κόσμο. Και πρέπει όλοι να έχουν ισότιμη πρόσβαση σε μεγάλο όγκο δεδομένων», λέει ο Αρης Κοζύρης, καθηγητής του ΕΜΠ και διευθυντής του εργαστηρίου πληροφορικής που ασχολείται με το e-science και τις εφαρμογές του στη χώρα μας. «Ο λόγος είναι ότι γίνονται πλέον μεγάλα πειράματα που απαιτούν συνεργασία και πρόσβαση πολλών στα δεδομένα. Μόνο μέσω του e-science γίνεται αυτό. Εκτός από τους φυσικούς, αυτοί που ωφελούνται από αυτή τη νέα φιλοσοφία είναι οι βιολόγοι, οι μετεωρολόγοι κ. ά.».

Ελεύθερα τα δεδομένα

Εκτός από το CERN, προγράμματα e-science έχουν ανακοινώσει και λειτουργούν υπηρεσίες σε Ευρώπη και Αμερική, όπως η αμερικανική μετεωρολογική υπηρεσία, βρετανικά πανεπιστήμια, όπως αυτό της Οξφόρδης κ. ά. Το άνοιγμα των υποδομών και των δεδομένων όμως ωθεί με τη σειρά του μια νέα αντίληψη και για τη διαχείριση των αποτελεσμάτων των ερευνών, ακολουθώντας μοιραία το μοντέλο της βιομηχανίας λογισμικού ανοιχτού κώδικα. Η Google τον Απρίλιο ανακοίνωσε την έναρξη της υπηρεσίας research στην οποία επιστήμονες αποθηκεύουν επιστημονικά δεδομένα «ανοιχτού κώδικα», ήτοι ελεύθερης πρόσβασης.

Ερευνα γύρω από την πιθανή ανάπτυξη φαρμάκων για τον καρκίνο, την κατασκευή νέων υλικών και πολλά άλλα γίνεται ήδη από κάποιους επιστήμονες με τον ίδιο τρόπο με τον οποίο γράφουν λογισμικό ανοιχτού κώδικα οι προγραμματιστές. Γύρω από ένα ερώτημα και με συμφωνημένη τη μεθοδολογία παράγονται αποτελέσματα ελεύθερα για οποιονδήποτε τα χρειάζεται.

Οι βιολογικές εφαρμογές

Το ΕΜΠ σε συνεργασία με το κέντρο Ιατροβιολογικών Ερευνών «Αλέξανδρος Φλέμινγκ» έχουν ήδη φτιάξει και λειτουργούν ένα cloud με βιολογικά δεδομένα στο επιστημονικό πεδίο του microRNA. Οι ερευνητές υποβάλλουν ερωτήματα στο cluster DIANA (DNA intelligent analysis) που βρίσκεται στο υπολογιστικό κέντρο του ΕΜΠ κι αυτό με την σειρά του κάνει τους σχετικούς υπολογισμούς ώστε να δώσει τα αποτελέσματα που ψάχνει ο ερευνητής. Ταυτόχρονα όμως του παρουσιάζει και τα σχετικά ερωτήματα και λύσεις που έχει δώσει το δίκτυο στα προβλήματα άλλων ερευνητών.

«Στο Εθνικό Δίκτυο Ερευνας και Τεχνολογίας προσπαθούμε να μετατρέψουμε τις υποδομές μας σε cloud. Τον Νοέμβριο θα είμαστε σε θέση να ανακοινώσουμε τη διάθεση σχετικών υπηρεσιών. Θα δώσουμε στους ερευνητές εικονικούς servers και αποθηκευτικό χώρο, πάνω στα οποία θα μπορούν να σχεδιάζουν μόνοι τους τις εφαρμογές τους», λέει ο κ. Αρης Κοζύρης.

Δύο διαφορετικές φιλοσοφίες

«Ερευνητικές υποδομές που αναπτύσσονται πλέον συνεργατικά διεθνώς, είναι ανοιχτές και κατανεμημένες. Μια ιδέα είναι αυτή του Grid το οποίο όμως δίνει δικαιώματα χρήσης σε μέλη μιας συγκεκριμένης κοινότητας και αυστηρή δομή. Από την άλλη κερδίζει έδαφος η ιδέα του cloud computing, όπου οι δομές είναι ανοιχτές στον καθένα, είτε θέλει να αποθηκεύσει δεδομένα είτε να χρησιμοποιήσει λογισμικό, το οποίο από προϊόν με άδεια χρήσης μετατρέπεται πλέον σε υπηρεσία», εξηγεί ο Αρης Κοζύρης.

«Το Grid είναι αυστηρό. Πρέπει να είναι κανείς μέλος της κοινότητας. Το Grid δεν αφήνει, για παράδειγμα, κάποιον να σηκώσει τις δικές του εφαρμογές. Απαιτεί έναν συγκεκριμένο τρόπο σκέψης και λειτουργίας. Το cloud, αντίθετα, είναι ανοιχτό».

Advertisements
  1. 1- Όλα τα επιστημονικά μοντέλα είναι λάθος, αλλά μερικά μας είναι χρήσιμα.

    2- Το επώνυμο του Άρη είναι Κοζύρης.

    3- Πραγματικά τέτοιες μπρούρδες μόνο ο Chris Anderson θα μπορούσε να γράψει. Οι απλοποιήσεις που υπονοεί και αναπαράγεις οδηγούν σε εντελώς λανθασμένα συμπεράσματα τον κόσμο. Στην πραγματικότητα τα περισσότερα δεδομένα μας δίνουν τη δυνατότητα ανά πάσα στιγμή στον ίδιο μεγάλο όγκο δεδομένων και σε συνδιασμό με το cloud (δηλαδή πιο γρήγορα) να δοκιμάζουμε διαφορετικές θεωρίες, ανεξάρτητα από το εάν παράχθηκαν μηχανικά ή όχι.

    Αν και αυτό (πολλά δεδομένα) δεν σημαίνει απαραίτητα κάτι. Π.χ. εάν σου δώσω ένα petabyte με σειρές ζευγών αριθμών για τους οποίους ισχύει x + y = x * y θα βγάλεις το συμπέρασμα πως ο πολλαπλασσιασμός και η πρόσθεση είναι γενικά η ίδια πράξη;

    Το ότι κάποιος γράφει στο wired (και έχει πάρει τα μυαλά του κόσμου με ένα βιβλίο που θα μπορούσε να γράφει τα ίδια πράγματα σε 10 σελίδες) δεν σημαίνει πως ότι γράφει είναι και σωστό.

    Γράφεις επίσης: «όμως χάρη στους υπολογιστές μπορούμε να τα παράγουμε χωρίς καν να καταλαβαίνουμε τι ακριβώς σημαίνουν. Το μόνο που χρειάζεται πραγματικά να καταλαβαίνουμε είναι τα εφαρμοσμένα μαθηματικά, που θα παράγουν τις λύσεις που χρειαζόμαστε.»

    1- Εάν καταλαβαίνουμε τα μαθηματικά που παράγουν το μοντέλο, καταλαβαίνουμε το μοντέλο.

    2- Εγώ θα έψαχνα να βρω ακριβώς το context μέσα στο οποίο ο Norvig είπε το «All models are wrong, and increasingly you can succeed without them.» γιατί δεν είμαι σίγουρος πως ο Anderson και ο Norvig λένε το ίδιο πράγμα. Γιατί η ομιλία του Norvig ονομάζεται Practice Makes Perfect: How Billions of Examples Lead to Better Models. Και η περιγραφή της είναι κάτι διαφορετικό από αυτό που καταλαβαίνει ο Anderson. Του ζήτησα τα slides της ομιλίας.

  2. @adamo
    1 correct
    2 correct
    3 Οι απλοποιήσεις που υπονοεί και αναπαράγεις οδηγούν σε εντελώς λανθασμένα συμπεράσματα τον κόσμο : «Το κείμενο αυτό συνάντησε σφοδρές αντιδράσεις στον επιστημονικό κόσμο..»

    -Το ότι κάποιος γράφει στο wired δεν σημαίνει πως ότι γράφει είναι και σωστό: «όμως το σκηνικό στο οποίο αναφέρεται δεν αλλάζει. Oλο και μεγαλύτερα πειράματα απαιτούν περισσότερη διεθνή συνεργασία και άνοιγμα των υποδομών και των παραγόμενων δεδομένων, κάτι που μπορεί να επιτευχθεί μόνο με τη βοήθεια των υπολογιστών. Με δυο λόγια, είμαστε πια στην εποχή του e-science» – δηλαδή χρησιμοποιείται ο Anderson σαν μια ακόμα ιδεα που προκύπτει απο μια μεγάλη μεταβολή και σαν αφορμή για να μιλήσουμε για escience. Αν υπάρχει ενσταση, την ακούω.

    4. Εγώ θα έψαχνα να βρω ακριβώς το context μέσα στο οποίο ο Norvig είπε το “All models are wrong, and increasingly you can succeed without them: I never went that far. I wouldn’t dare in 600 words. Suggest further reading to link from here.

    Πρέπει να ξαναπώ οτι τα κείμενα αυτά στο Σαββατιάτικο φύλο είναι μικρά εισαγωγικά και τα κάνω για να ελέγξω τις δυνατότητες να υπάρξουν στην εφημερίδα αυτά τα θέματα και με ποιό τρόπο. Πολλές φορές είναι ατελή αλλά, νομίζω σε καμιά περίπτωση παραπλανητικά.

  3. @tsimitakis:

    – Για το #3: Η ένστασή μου είναι η χρήση του Anderson. Αν και δεν μου αρέσει ο όρος e-science, δε νομίζω πως χρειάζεται ο Anderson για να εισαγάγεις το θέμα προς συζήτηση. Εάν κάποιος έχει μια καλή ιδέα για ένα θέμα, δεν σημαίνει πως θα έχει καλές ιδέες για κάθε θέμα.

    – Για το #4: Ρώτησα τον ίδιο τον Norvig σε σχέση με το συγκεκριμένο quotation από τον Anderson. Όχι μόνο ο Norvig δεν είπε κάτι τέτοιο ποτέ, αλλά ο Anderson του είπε πως ούτε ο ίδιος πιστεύει τον τίτλο του άρθρου του!!!

    Μου έστειλε μάλλιστα και την αλληλογραφία με τον fact-checker του Wired. (Δε μου έστειλε τις διαφάνειες γιατί δεν τις είχε πρόχειρες).

    Για να είμαι ακριβής, δεν ισχυρίζομαι πως το δικό σου κείμενο είναι παραπλανητικό. Ισχυρίζομαι όμως πως αυτό του Anderson σε οδήγησε σε λάθος δρόμο, γιατί o Norvig δεν είπε ποτέ αυτό το πράγμα.

  1. No trackbacks yet.

Σχολιάστε

Εισάγετε τα παρακάτω στοιχεία ή επιλέξτε ένα εικονίδιο για να συνδεθείτε:

Λογότυπο WordPress.com

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό WordPress.com. Αποσύνδεση / Αλλαγή )

Φωτογραφία Twitter

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Twitter. Αποσύνδεση / Αλλαγή )

Φωτογραφία Facebook

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Facebook. Αποσύνδεση / Αλλαγή )

Φωτογραφία Google+

Σχολιάζετε χρησιμοποιώντας τον λογαριασμό Google+. Αποσύνδεση / Αλλαγή )

Σύνδεση με %s

Αρέσει σε %d bloggers: