Cyborg
Cyborg #13 - 10/2018

#14 - 02/2019

τεχνητή νοημοσύνη: το Γκόλεμ της 4ης βιομηχανικής επανάστασης

Ίσως να τη θυμάστε, ίσως και όχι. Υπάρχει μια μέθοδος στη στατιστική, αρκετά απλή και διαδεδομένη ώστε συχνά να διδάσκεται ακόμα και στο λύκειο. Πρόκειται για τη λεγόμενη μέθοδο ελαχίστων τετραγώνων. Το πρόβλημα που καλείται να λύσει η εν λόγω μέθοδος είναι το εξής: έστω ότι έχουμε λάβει κάποια δεδομένα από ένα πείραμα ή από μία δειγματοληψία τα οποία σχεδιάζουμε ως σημεία σε ένα επίπεδο με δύο άξονες – τους γνωστούς άξονες x και y – και αυτά τα σημεία φαίνεται να σχηματίζουν μια ευθεία. Ποια ακριβώς όμως θα έπρεπε να είναι αυτή η ευθεία, αν έπρεπε να τη χαράξουμε στο χαρτί, από τη στιγμή που πολλές ευθείες (με κάποιες μικροδιαφορές στην κλίση τους) θα μπορούσαν να ταιριάξουν αρκετά καλά (δηλαδή να είναι αρκετά κοντά) με τα σημεία των δεδομένων; Την απάντηση τη δίνει η μέθοδος ελαχίστων τετραγώνων. Απ’ όλες τις δυνατές ευθείες, θα «πρέπει» να επιλεγεί εκείνη που είναι πιο κοντά στα δεδομένα, με την έννοια ότι, αν μετρήσουμε όλες τις αποστάσεις των σημείων από την ευθεία και μετά τις αθροίσουμε, τότε αυτό το άθροισμα θα πρέπει να είναι το μικρότερο δυνατό σε σχέση με το άθροισμα που θα προέκυπτε επιλέγοντας οποιαδήποτε άλλη ευθεία. [1Στην πραγματικότητα αθροίζονται τα τετράγωνα των αποστάσεων, εξ ου και ο όρος «ελαχίστων τετραγώνων».]

Η σημασία μιας τέτοιας μεθόδου ταιριάσματος μιας ευθείας (επί της ουσίας μιας εξίσωσης) σε κάποια πειραματικά δεδομένα έγκειται στο ότι δίνει τη δυνατότητα της «πρόβλεψης». Αν, για παράδειγμα, τα δεδομένα αφορούν στο ύψος (στον x άξονα)  ενός δείγματος ανθρώπων σε σχέση με το βάρος τους (στον y άξονα) τότε η ευθεία που προκύπτει συνιστά κι ένα στατιστικό μοντέλο της εξάρτησης του βάρους από το ύψος. Σε περίπτωση που μετρήσουμε το ύψος ενός ανθρώπου χωρίς να γνωρίζουμε το βάρος του (και χωρίς αυτό το νέο δείγμα-άνθρωπος να υπάρχει ήδη στα αρχικά μας δεδομένα), τότε μπορούμε να χρησιμοποιήσουμε την ευθεία που έχουμε ήδη εξαγάγει για να «προβλέψουμε» ποιο περίπου θα είναι το βάρος του. Εφόσον ξέρουμε σε ποιο x-ύψος πέφτει το νέο δείγμα, μπορούμε να βρούμε το σημείο της ευθείας που του αντιστοιχεί κι από εκεί να βρούμε και το y-βάρος.

Η μέθοδος ελαχίστων τετραγώνων.

Η μέθοδος ελαχίστων τετραγώνων. Οι γραμμές που συνδέουν τα κουτάκια με την ευθεία είναι οι αποστάσεις. Αθροίζοντας αυτές τις αποστάσεις, παίρνουμε τη συνολική απόσταση των σημείων από την ευθεία. Η καλύτερη ευθεία είναι αυτή που έχει τη μικρότερη συνολική απόσταση από τα σημεία – τετράγωνα.

Πρόκειται για μια εξαιρετικά απλή μέθοδο που προφανώς προγραμματίζεται πολύ εύκολα σε έναν υπολογιστή. Αν, τώρα, έβγαινε κάποιος μεγαλόσχημος επιστήμονας και πομπωδώς ανακοίνωνε ότι ένας υπολογιστής προγραμματισμένος να εκτελεί τη μέθοδο ελαχίστων τετραγώνων αποτελεί δείγμα τεχνητής νοημοσύνης, δικαίως θα ανέμενε κανείς μια χιονοστιβάδα χλευαστικών σχολίων ως αντίδραση. Κι όμως, με μια (μικρή) δόση υπερβολής, αυτό ακριβώς συμβαίνει τα τελευταία χρόνια με τη λεγόμενη αναγέννηση της μηχανικής μάθησης. Χωρίς όμως κάποια αντίδραση! Αφού η Google μπορεί αυτόματα να αναγνωρίζει γατάκια σε βίντεο του youtube, ε, κάποια «νοημοσύνη» θα πρέπει να υπάρχει από πίσω. Όποιος όμως έχει καταλάβει τη λογική της μεθόδου ελαχίστων τετραγώνων, έχει ήδη κατανοήσει και ένα τεράστιο κομμάτι από τον πυρήνα αυτού που λέγεται μηχανική μάθηση κι έχει κάνει ένα καλό βήμα προς την απομυστικοποίησή της. Οι μέθοδοι μηχανικής μάθησης στοχεύουν ακριβώς στην εξαγωγή στατιστικών μοντέλων από δεδομένα, υπό τη μορφή καμπυλών συσχέτισης ορισμένων μεταβλητών με κάποιες άλλες. Η διαφορά σε σχέση με την απλή μέθοδο ελαχίστων τετραγώνων δεν είναι ποιοτική, αλλά διαφορά στον βαθμό πολυπλοκότητας. Τα πιο εξελιγμένα μοντέλα μηχανικής μάθησης, όπως τα περίφημα νευρωνικά δίκτυα, έχουν τη δυνατότητα εξαγωγής περίπλοκων καμπυλών (και όχι μόνο απλών ευθειών) που μπορούν να συσχετίζουν εκατοντάδες ή και χιλιάδες μεταβλητές (και όχι μόνο δύο)· κάτι που φυσικά απαιτεί μαθηματικά εργαλεία αρκετά πιο εξελιγμένα. Στον πυρήνα τους όμως κάνουν ακριβώς το ίδιο: βρίσκουν καμπύλες που ταιριάζουν όσο το δυνατόν καλύτερα σε κάποια δεδομένα ώστε να μπορούν να προβλέψουν την τιμή κάποιων μεταβλητών σε νέα δεδομένα που δεν έχουν ξαναδεί.  
Η καχυποψία απέναντι στα ιδεολογήματα που συστηματικά παράγει ο χώρος της τεχνητής νοημοσύνης, όσο και η κριτική αποδόμησή τους, αποτελούν βασικά καθήκοντα μιας σκέψης που διεκδικεί να παραμείνει ανταγωνιστική. Στο βαθμό ωστόσο που τέτοιες κριτικές απόπειρες παραμένουν σε ένα επίπεδο αμιγώς φιλοσοφικό (επιχειρώντας να δείξουν γιατί η τεχνητή νοημοσύνη μπορεί να μην είναι εν τέλει και τόσο νοήμων [2Κάπου εκεί εξαντλούν την κριτική τους πολλά από τα έργα γνωστών φιλοσόφων που εναντιώνονται στη δυνατότητα μιας πραγματικής τεχνητής νοημοσύνης, με τυπικά παραδείγματα αυτά των Hubert Dreyfus και John Searle.]) διατρέχουν τον κίνδυνο να παραβλέψουν αυτό που μπορεί να είναι εξίσου ή ακόμα πιο βαρύνουσας σημασίας. Η τεχνητή νοημοσύνη, ακόμα κι αν της αρνηθεί κανείς τις ιδιότητες μιας «πραγματικής» νοημοσύνης, συνιστά έναν από τους βασικούς βραχίονες της τρέχουσας αναδιάρθρωσης του καπιταλισμού προς το μοντέλο της καθολικής μηχανικής διαμεσολάβησης. Κι ως τέτοια, θα πρέπει να λαμβάνεται σοβαρά υπόψιν, ακόμα κι αν οι έριδες περί του βαθμού «πραγματικότητάς» της δεν καταλαγιάσουν ποτέ.

oρολογικά

Πριν μιλήσει κανείς για την πραγματικότητα ή μη της όποιας κατασκευασμένης, τεχνητής νοημοσύνης, θα έπρεπε να υπάρχει μια κατ’ αρχήν συμφωνία μεταξύ των εμπλεκομένων επιστημόνων σχετικά με το ίδιο το αντικείμενο που πραγματεύεται ο κλάδος τους. Αυτό τουλάχιστον υποτίθεται ότι επιτάσσει η πολιτική ορθότητα της επιστημονικής πρακτικής· κι ένας αδαής, κοιτώντας απ’ έξω, θα περίμενε ότι αυτό θα ήταν ένα ξεκαθαρισμένο ζήτημα. Φευ! Η τεχνητή νοημοσύνη κατέχει την «αξιοζήλευτη» θέση να είναι μια επιστήμη με το διπλό πρόσωπο του Ιανού. Φυλλομετρώντας ένα εκλαϊκευτικό βιβλίο γύρω από το θέμα, [3Τυπικό παράδειγμα είναι το (ομολογουμένως κάπως παλιό) βιβλίο του John Haugeland, Τεχνητή νοημοσύνη, εκδ. Κάτοπτρο.] θα δει κανείς να παρελαύνουν βαριά ονόματα από την ιστορία της δυτικής φιλοσοφίας και μεγαλεπήβολες ιδέες για μηχανές με την ικανότητα να «σκέφτονται». Σχεδόν σαν να πρόκειται για έναν κλάδο εφαρμοσμένης φιλοσοφίας με τον φιλόδοξο στόχο να ξεδιαλύνει επιτέλους τα μυστήρια της νόησης. Αντίθετα, σε ένα τεχνικό εγχειρίδιο τεχνητής νοημοσύνης που έχει ως στόχο να εκπαιδεύσει νέους επιστήμονες πάνω σε πραγματικές εφαρμογές της, [4Κλασσικό τέτοιο εγχειρίδιο είναι το βιβλίο των Russel και Norvig, Artificial intelligence: a modern approach.] οι φιλόσοφοι μετά βίας βρίσκουν μια κάποια θέση, υπό τη μορφή σύντομων ιστορικών υποσημειώσεων. Στην πρώτη γραμμή βρίσκονται τεχνικές για πώς ένας υπολογιστής μπορεί να ψάχνει αποδοτικά όλες τις δυνατές κινήσεις σε παιχνίδια σαν το σκάκι, για το πώς στατιστικές μέθοδοι (σαν αυτή που περιγράψαμε) μπορούν να αποτελέσουν τη βάση για συστήματα αυτόματης διάγνωσης ασθενειών ή για την κατηγοριοποίηση εικόνων κ.ο.κ. Οι αναφορές σε μηχανές που «πραγματικά σκέφτονται» φυσικά δεν λείπουν· σε καμία περίπτωση όμως δεν κατέχουν κεντρική θέση και διατυπώνονται με μια (πολύ) συγκρατημένη αισιοδοξία.

Εδώ δεν πρόκειται (μόνο) για το σύνηθες χάσμα ανάμεσα στην εκλαϊκευμένη παρουσίαση μιας επιστήμης, που κατ’ ανάγκη κινείται σε ένα πιο υψηλό επίπεδο αφαίρεσης, και στα πιο δύσβατα τεχνικά περιεχόμενά της που αφορούν σχεδόν κατ’ αποκλειστικότητα τους ειδικούς. Είναι μια πραγματικά σχιζοειδής κατάσταση που ταλαιπωρεί την τεχνητή νοημοσύνη εδώ και δεκαετίες· με την πάθηση μάλιστα να έχει βρει και όνομα στην αντιδιαστολή μεταξύ γενικής (artificial general intelligence ή strong AI) και στενής τεχνητής νοημοσύνης (narrow ή weak ΑΙ). Η πρώτη (υποτίθεται ότι) ασχολείται με τα μεγάλα φιλοσοφικά ερωτήματα περί νόησης και σκέψης και σκοπός της είναι η κατασκευή πραγματικά σκεπτόμενων μηχανών. Στην πράξη, τα αποτελέσματα που έχει να επιδείξει μέχρι τώρα είναι πενιχρά. Η δεύτερη έχει πιο ταπεινές φιλοδοξίες και περιορίζεται στην κατασκευή μηχανών που εστιάζουν στην επίλυση συγκεκριμένων προβλημάτων (π.χ., να παίζουν σκάκι), αδιαφορώντας επί της ουσίας για το αν ο τρόπος με τον οποίο βρίσκουν λύσεις έχει κάποια σχέση με τις ανθρώπινες νοητικές ικανότητες. Με ταπεινές φιλοδοξίες μεν, αλλά με αξιοσημείωτα και χειροπιαστά βήματα προόδου, ειδικότερα τα τελευταία χρόνια.

[...]

...η συνέχεια στο έντυπο τεύχος του Cyborg.
[ σημεία διακίνησης ]

Separatrix

εκπαιδευμένο νευρωνικό της Google

Μερικές φωτογραφίες και οι ερμηνείες που δίνει σε αυτές ένα εκπαιδευμένο νευρωνικό της Google. Από το άρθρο του Yarden Katz, Manufacturing an Artificial Intelligence Revolution. Ο Katz είναι επιστήμονας ισραηλινής καταγωγής και ισχυρά επικριτικός των πρακτικών του ισραηλινού καθεστώτος, εξ ου και η επιλογή της πρώτης και της τελευταίας φωτογραφίας. Φαίνεται ότι ο Katz είναι ένας απ’ τους χιλιάδες εβραίους που μισούν τον εαυτό τους, κατά τις βαθυστόχαστες αναλύσεις όσων (ακόμα και «επαναστατών») ταυτίζουν τον αντισιωνισμό με τον αντισημιτισμό.

Σημειώσεις

1 - Στην πραγματικότητα αθροίζονται τα τετράγωνα των αποστάσεων, εξ ου και ο όρος «ελαχίστων τετραγώνων».
[ επιστροφή ]

2 - Κάπου εκεί εξαντλούν την κριτική τους πολλά από τα έργα γνωστών φιλοσόφων που εναντιώνονται στη δυνατότητα μιας πραγματικής τεχνητής νοημοσύνης, με τυπικά παραδείγματα αυτά των Hubert Dreyfus και John Searle.
[ επιστροφή ]

3 - Τυπικό παράδειγμα είναι το (ομολογουμένως κάπως παλιό) βιβλίο του John Haugeland, Τεχνητή νοημοσύνη, εκδ. Κάτοπτρο.
[ επιστροφή ]

4 - Κλασσικό τέτοιο εγχειρίδιο είναι το βιβλίο των Russel και Norvig, Artificial intelligence: a modern approach.
[ επιστροφή ]

κορυφή