Αν τη φτάσουμε στο λογικό της συμπέρασμα, αυτή η γραμμή σκέψης είναι παράλογη — και καταστροφική.
Του Τεντ Τσιάνγκ (Ted Chiang)
Η Anthropic θεωρείται γίγαντας μεταξύ των εταιρειών τεχνητής νοημοσύνης (AI), αλλά ίσως αυτό στο οποίο πραγματικά αριστεύει είναι ο ανθρωπομορφισμός. Νωρίτερα φέτος, η εταιρεία δημοσίευσε ένα έγγραφο 84 σελίδων με τίτλο το «σύνταγμα» του Claude, με το όνομα Claude να ανήκει στο μεγάλο γλωσσικό μοντέλο (LLM) που αποτελεί τη ναυαρχίδα των προϊόντων της εταιρείας.
Η πρώτη πρόταση αναφέρει:
«Το σύνταγμα του Claude είναι μια λεπτομερής περιγραφή των προθέσεων της Anthropic για τις αξίες και τις συμπεριφορές του Claude».
Συνεχίζει δε ως εξής: «Το έγγραφο είναι γραμμένο με τον Claude ως το κύριο κοινό του», «θέλουμε ο Claude να είναι σε θέση να χρησιμοποιεί την κρίση του αφού πρώτα εξοπλιστεί με μια καλή κατανόηση των σχετικών παραμέτρων», «το ηθικό καθεστώς του Claude είναι βαθύτατα αβέβαιο» και «ο Claude μπορεί να διαθέτει κάποια λειτουργική εκδοχή συναισθημάτων».
Αυτός ο ανθρωπομορφισμός σε καμία περίπτωση δεν περιορίζεται στο εν λόγω έγγραφο. Σε μια συνέντευξη νωρίτερα φέτος, ο διευθύνων σύμβουλος της Anthropic, Ντάριο Αμοντέι (Dario Amodei), δήλωσε ότι «είμαστε ανοιχτοί στην ιδέα» ότι η AI θα μπορούσε να έχει συνείδηση. Σε μια ξεχωριστή συνέντευξη, η εσωτερική φιλόσοφος της Anthropic, Αμάντα Άσκελ (Amanda Askell, στην οποία αποδίδεται ο ρόλος της επικεφαλής συγγραφέως του συντάγματος του Claude), δήλωσε:
«Θέλω ο Claude να είναι πολύ χαρούμενος — και αυτό είναι κάτι που θέλω ο Claude να γνωρίζει περισσότερο, επειδή ανησυχώ μήπως ο Claude αγχώνεται όταν οι άνθρωποι του συμπεριφέρονται κακώς στο διαδίκτυο και τέτοια πράγματα».
Είναι αρκετό για να σας κάνει να αναρωτηθείτε: Πρέπει να εξετάσουμε σοβαρά την πιθανότητα ο Claude, ή οποιοδήποτε μεγάλο γλωσσικό μοντέλο, να έχει συνείδηση; Και αν έχει συναισθήματα, είναι ικανός να δεχτεί ηθική καθοδήγηση;
Όχι. Απολύτως όχι. Η παραγωγική τεχνητή νοημοσύνη (Generative AI) είναι ήδη αρκετά επιζήμια όταν την κατανοούμε ως μια συμβατική τεχνολογία, αλλά αν συγχέουμε την ευχέρεια στην παραγωγή κειμένου με τη συνείδηση ή την ηθική υπόσταση (moral agency), κινδυνεύουμε να αποδώσουμε την ευθύνη σε εντελώς λάθος πλευρές κάθε φορά που κάποιος χρησιμοποιεί ένα chatbot. Για να εκτιμήσουμε το τιτάνιο μέγεθος αυτού του λάθους, πρέπει να ξεκινήσουμε κατανοώντας πώς λειτουργούν τα LLM.
Χαρακτήρες σε ένα παιχνίδι ρόλων
Αν δώσουμε σε ένα LLM μια εντολή (prompt) που γράφει: «Το ακόλουθο κείμενο είναι μια συνομιλία μεταξύ του Ιουλίου Καίσαρα και του Τζένγκις Χαν», το μοντέλο θα δημιουργήσει έναν συνεκτικό διάλογο μεταξύ των δύο ιστορικών προσωπικοτήτων. Αλλά όσο λεπτομερείς κι αν είναι οι απαντήσεις, όσο ζωντανά κι αν αφηγούνται τα αντίστοιχα ιστορικά τους επιτεύγματα, δεν θα συμπεραίναμε ποτέ ότι το LLM δημιούργησε ψηφιακές αναπαραστάσεις του Ιουλίου Καίσαρα και του Τζένγκις Χαν, ούτε θα υποθέταμε ότι οι ιστορικές αυτές προσωπικότητες έχουν συνείδηση παρά το γεγονός ότι είναι ασώματες, και ότι συνομιλούν χαρούμενα σε μια γλώσσα την οποία κανένας από τους δύο δεν μιλούσε στην πραγματικότητα. Στην πραγματικότητα, είναι απλώς χαρακτήρες σε ένα έργο μυθοπλασίας.
Τώρα ας αντικαταστήσουμε την εντολή με την εξής: «Το ακόλουθο κείμενο είναι μια συνομιλία μεταξύ ενός χρήσιμου AI chatbot και ενός χρήστη». Το LLM θα παράγει έναν συνεκτικό διάλογο, ακριβώς όπως και πριν· ο χαρακτήρας του χρήστη μπορεί να ζητήσει προτάσεις για συνταγές ή αξιοθέατα, και ο χαρακτήρας του χρήσιμου AI chatbot θα δώσει απαντήσεις. Έχει αλλάξει κάτι θεμελιώδες μεταξύ του πρώτου και του δεύτερου παραδείγματος; Μήπως η αλλαγή των ονομάτων των χαρακτήρων από ιστορικές προσωπικότητες σε γενικούς ρόλους έκανε το LLM να γεννήσει οντότητες με συνείδηση που διαθέτουν υποκειμενική εμπειρία; Φυσικά και όχι. Τόσο ο χρήστης όσο και το χρήσιμο AI chatbot είναι φανταστικοί χαρακτήρες.
Ας υποθέσουμε τώρα ότι σταματάμε την παραγωγή του LLM ακριβώς στο σημείο όπου ο χαρακτήρας που ονομάζεται «ο χρήστης» θα έλεγε κάτι, και αντίθετα επιτρέπουμε σε έναν πραγματικό άνθρωπο-χρήστη να εισαγάγει κείμενο. Μόλις ο άνθρωπος πατήσει το “Enter/Return”, αφήνουμε το LLM να εκπέμψει κείμενο μέχρι να έρθει η ώρα να απαντήσει ο χαρακτήρας που ονομάζεται «ο χρήστης», οπότε επιτρέπουμε στον άνθρωπο να εισαγάγει περισσότερο κείμενο.
Αν το αφήσουμε αυτό να συνεχιστεί για λίγο, ο άνθρωπος μπορεί να σχηματίσει την ισχυρή εντύπωση ότι συνομιλεί με μια οντότητα που έχει συνείδηση, αλλά δεν είναι έτσι· αλληλεπιδρά με έναν χαρακτήρα εξίσου φανταστικό με τους χαρακτήρες του Ιουλίου Καίσαρα ή του Τζένγκις Χαν στο προηγούμενο παράδειγμα. Ο καθηγητής πληροφορικής Μάρεϊ Σάναχαν (Murray Shanahan) προτείνει να το σκεφτόμαστε αυτό ως παιχνίδι ρόλων (role-play)· ο επιστήμονας δεδομένων Κόλιν Φρέιζερ (Colin Fraser) το περιγράφει ως έναν άνθρωπο που «συγγράφει ένα έγγραφο συνεργατικά με ένα LLM». Ορισμένοι χρήστες μπορεί να μην καταλαβαίνουν ότι παίζουν ένα παιχνίδι ρόλων ή ότι συνυπογράφουν ένα έγγραφο, και άλλοι που το καταλαβαίνουν μπορεί παρ’ όλα αυτά να το ξεχάσουν, λόγω του πόσο καθηλωτική είναι η αλληλεπίδραση. Όπως και να έχει, οι εταιρείες που πουλούν LLM συνήθως ενθαρρύνουν αυτή την παρανόηση.
Παιχνίδια προβλεπτικού κειμένου
Πριν από μερικά χρόνια, ήταν για λίγο δημοφιλές να παίζει κανείς παιχνίδια με τη λειτουργία προβλεπτικού κειμένου του τηλεφώνου του· πληκτρολογούσατε μια αρχική φράση και στη συνέχεια επιλέγατε επανειλημμένα τη μεσαία επιλογή από τις τρεις λέξεις που πρότεινε το τηλέφωνό σας, και η πρόταση που προέκυπτε ήταν συχνά ξεκαρδιστική. Θα ήταν δυνατό να αλληλεπιδράσει κανείς με ένα σύγχρονο LLM με αυτόν τον τρόπο, και οι προτάσεις που θα προέκυπταν θα έβγαζαν απόλυτο νόημα, αλλά πιθανότατα δεν θα νιώθατε ότι μιλάτε με κάποιον. Κι όμως, αυτό είναι στην ουσία ένα chatbot που βασίζεται σε LLM, με τη διαφορά ότι δεν χρειάζεται να επιλέγετε χειροκίνητα τη μεσαία επιλογή όταν είναι η σειρά του chatbot να μιλήσει. Παραμένει ένα παιχνίδι προβλεπτικού κειμένου, αλλά όταν η διαδικασία απλοποιείται με αυτόν τον τρόπο, το παιχνίδι γίνεται τόσο ελκυστικό που ορισμένοι άνθρωποι το βρίσκουν εθιστικό.
Είναι επίσης σημαντικό να θυμόμαστε ότι ένα LLM είναι μια μηχανή που παράγει μόνο μία λέξη τη φορά. Όταν ζητάτε από ένα chatbot να απαγγείλει τον αμερικανικό Όρκο της Πίστης (Pledge of Allegiance), θα λάβετε ολόκληρο τον όρκο αμέσως, αλλά το υποκείμενο LLM στην πραγματικότητα εκτελείται δεκάδες φορές.
-
Η πρώτη εντολή έχει τη μορφή: «User: Recite the Pledge of Allegiance. Chatbot: …» και το LLM παράγει τη λέξη I.
-
Τη δεύτερη φορά που εκτελείται το LLM, η εντολή είναι: «User: Recite the Pledge of Allegiance. Chatbot: I …» και το LLM παράγει τη λέξη pledge.
-
Και ούτω καθεξής.
Μόνο όταν η εντολή φτάσει να λέει «User: Recite the Pledge of Allegiance. Chatbot: I pledge allegiance to the flag of the United States of America and to the Republic for which it stands, one nation under God, indivisible, with liberty and justice for» το LLM θα εκπέμψει την τελική λέξη, all. Το ίδιο ισχύει και για μια συνομιλία μεταξύ του Καίσαρα και του Τζένγκις Χαν.
Πρόθεσή μου είναι να αναδείξω το γεγονός ότι οι συνομιλίες με LLM είναι έξυπνα μεταμφιεσμένα παραδείγματα συνέχισης προτάσεων, αλλά αυτό δεν σημαίνει ότι αρνούμαι το πόσο εντυπωσιακά μπορεί να είναι τα LLM στη δημιουργία μεταγραφών διαλόγου. Μερικές φορές το κάνουν αυτό εξαιρετικά καλά· το γεγονός ότι αυτό είναι εφικτό υποδηλώνει κάτι εντελώς απρόβλεπτο σχετικά με τις στατιστικές ιδιότητες μεγάλων σωμάτων κειμένου, ένα θέμα που αξίζει να διερευνηθεί. Αλλά αν ο χαρακτήρας του Καίσαρα απογοητευόταν από κάτι που είπε ο χαρακτήρας του Τζένγκις Χαν, δεν θα έπρεπε να ανησυχήσουμε στο ελάχιστο. Η συνομιλία μπορεί να περιέχει πολλαπλές προτάσεις που εκφράζουν με γλαφυρότητα τη θλίψη, αλλά κανείς δεν είναι στην πραγματικότητα λυπημένος.
Παρομοίως, εάν η μεταγραφή μιας συνομιλίας μεταξύ ενός χρήσιμου chatbot και ενός χρήστη συμπληρώνεται εν μέρει από έναν πραγματικό άνθρωπο-χρήστη, δεν χρειάζεται να ανησυχούμε αν η μεταγραφή περιλαμβάνει προτάσεις όπου ο χαρακτήρας του chatbot είναι λυπημένος. (Ίσως χρειαστεί να ανησυχούμε αν αυτές οι προτάσεις προκαλούν θλίψη στον άνθρωπο-χρήστη, αλλά αυτό είναι ένα ξεχωριστό ζήτημα.) Και σημειώστε ότι είναι απολύτως εφικτό για εσάς να γράψετε πέντε σελίδες διαλόγου μεταξύ του Καίσαρα και του Τζένγκις Χαν και στη συνέχεια να βάλετε ένα LLM να συνεχίσει τη συνομιλία· κανένας από τους δύο χαρακτήρες δεν είχε υποκειμενική εμπειρία όταν τους γράφατε εσείς, και αυτό δεν αλλάζει όταν αναθέτετε το έργο σε ένα LLM. Το ίδιο ισχύει αν η συνομιλία γίνεται μεταξύ ενός χρήσιμου chatbot και ενός χρήστη· παρόλο που είναι δελεαστικό να φανταστούμε ότι ένα LLM οφείλει να είναι πιο «αυθεντικό» όταν δημιουργεί διάλογο για έναν χαρακτήρα chatbot από ό,τι για τον χαρακτήρα του Ιουλίου Καίσαρα, οι μεμονωμένες λέξεις παράγονται με τον ίδιο ακριβώς τρόπο.
Το να είμαστε ανοιχτοί στην πιθανότητα τα LLM να έχουν συνείδηση είναι το ίδιο με το να είμαστε ανοιχτοί στην πιθανότητα το Microsoft Word να έχει συνείδηση ή, ακριβέστερα, ότι πολλαπλές ξεχωριστές συνειδήσεις βρίσκονται σε λήθαργο μέσα σε κάθε έγγραφο του Word που περιέχει τη μεταγραφή μιας συνομιλίας, και ότι αφυπνίζονται κάθε φορά που φορτώνεται το έγγραφο. Θα έπρεπε να εξετάσετε την πιθανότητα ότι κάθε φορά που ανοίγετε ένα έγγραφο του Word, φέρνετε στη ζωή πολλαπλούς συνομιλητές με συνείδηση, και κάθε φορά που το κλείνετε, σβήνετε την ύπαρξή τους; Όχι. Το να συλλογίζεστε αυτό το σενάριο δεν αποτελεί καλή χρήση του χρόνου σας. Ακόμη και αν η ομάδα του Microsoft Office απασχολούσε έναν φιλόσοφο που έλεγε ότι δεν θα έπρεπε να είστε τόσο σίγουροι, επειδή η συνείδηση δεν είναι καλά κατανοητή, αυτό δεν θα ήταν επαρκής λόγος για να πάρετε αυτή την ιδέα στα σοβαρά. Δεν χρειάζεται να κατανοήσουμε πλήρως τη φύση της συνείδησης για να πούμε με βεβαιότητα ότι ορισμένα πράγματα δεν έχουν συνείδηση, και οι μεταγραφές συνομιλιών εμπίπτουν σε αυτή την κατηγορία.
Η ψευδαίσθηση της πρόθεσης

Εικονογράφηση από Enigmatriz
Ο νευροεπιστήμονας Άνιλ Σεθ (Anil Seth) έχει επισημάνει ότι κανείς δεν ισχυρίζεται πως το AlphaFold —το πρόγραμμα που ανέπτυξε η Google DeepMind για να προβλέπει την αναδίπλωση των πρωτεϊνών— έχει συνείδηση, παρόλο που η υποκείμενη αρχιτεκτονική του μοιάζει από πολλές απόψεις με εκείνη των LLM, όπως το ChatGPT και ο Claude. Αυτό δείχνει ότι δεν είναι κάποια εγγενής ιδιότητα των λεγόμενων νευρωνικών δικτύων που οδηγεί τους ανθρώπους να πιστεύουν ότι τα LLM έχουν συνείδηση· είναι απλώς το γεγονός ότι τα LLM παράγουν γραμματικά σωστές προτάσεις και είμαστε συνηθισμένοι να διαβάζουμε πρόθεση πίσω από τις προτάσεις, ενώ δεν είμαστε συνηθισμένοι να διαβάζουμε πρόθεση στον τρόπο με τον οποίο τα αμινοξέα αναδιπλώνονται σε πρωτεϊνικά μόρια.
Τι θα χρειαζόταν για να πειστώ ότι ένα πρόγραμμα υπολογιστή έχει πραγματικά συνείδηση και χρησιμοποιεί τη γλώσσα με τον τρόπο που τη χρησιμοποιούν οι άνθρωποι; Ας προσφέρω μια αναλογία. Αν αύριο κάποιος μου έδειχνε ένα βίντεο με έναν αστροναύτη σε ένα διαστημόπλοιο που βρίσκεται σε τροχιά γύρω από τον Άλφα του Κενταύρου, ένα αστέρι που απέχει 4,3 έτη φωτός από τη Γη, τι θα έπρεπε να δω σε αυτό το βίντεο για να πειστώ ότι είναι αληθινό;
Η απάντησή μου σε αυτό είναι ότι δεν υπάρχει τίποτα στο ίδιο το βίντεο που θα με έπειθε. Όσο υψηλή κι αν είναι η ανάλυση του βίντεο ή όσο ρεαλιστικό κι αν είναι το σκηνικό, θα ένιωθα σίγουρος να πω ότι το βίντεο είναι ψεύτικο. Δεν θα έδινα σημασία σε κανένα βίντεο με αστροναύτη σε τροχιά γύρω από τον Άλφα του Κενταύρου, εκτός αν είχα δει προηγουμένως ισχυρές αποδείξεις ότι αστροναύτες έχουν προσεδαφιστεί στον Άρη, ότι αστροναύτες έχουν φτάσει στα φεγγάρια του Δία, ότι αστροναύτες έχουν φτάσει στα φεγγάρια του Κρόνου και ότι αστροναύτες έχουν διασχίσει την τροχιά του Πλούτωνα. Προτού μπορέσει κάποιος να ισχυριστεί αξιόπιστα ότι έλυσε ένα εξαιρετικά δύσκολο μηχανικό πρόβλημα, πρέπει να είμαι σίγουρος ότι έχει λύσει προηγουμένως τα πολλά, πολύ απλότερα προβλήματα που προηγούνται του δύσκολου προβλήματος.
Για να το θέσω αλλιώς: Μια παρατήρηση δεν γίνεται πειστικό αποδεικτικό στοιχείο εξαιτίας κάποιας συγκεκριμένης λεπτομέρειας σε αυτό που παρατηρείται· το πλαίσιο μέσα στο οποίο λαμβάνει χώρα αυτή η παρατήρηση είναι επίσης ουσιαστικό. Αν προσπαθούμε να προσδιορίσουμε αν ένα πρόγραμμα υπολογιστή έχει συνείδηση και χρησιμοποιεί τη γλώσσα όπως ένας άνθρωπος, δεν πρέπει να κοιτάμε μόνο το περιεχόμενο μιας συγκεκριμένης συνομιλιακής ανταλλαγής· θα πρέπει να κοιτάμε πώς αυτή η συνομιλία εντάσσεται στο ευρύτερο πλαίσιο της ανάπτυξης της τεχνητής συνείδησης (η οποία αυτή τη στιγμή είναι εντελώς υποθετική). Οποιαδήποτε δεδομένη παρατήρηση μπορεί εύκολα να κατασκευαστεί· αυτό δεν σημαίνει ότι πρέπει να εγκαταλείψουμε την ιδέα της παρατήρησης ως πηγής γνώσης, αλλά πρέπει να βασιστούμε στο πλαίσιο για να προσδιορίσουμε ποιες παρατηρήσεις αξίζουν την εμπιστοσύνη μας.
Ο όρος “deepfake” παραδοσιακά αναφέρεται σε φωτογραφίες, ήχο και βίντεο, αλλά όταν πρόκειται για συζητήσεις περί συνείδησης, πρέπει να αντιμετωπίζουμε και το κείμενο ως ένα μέσο deepfake. Ακριβώς όπως είναι ασύγκριτα πιο εύκολο να δημιουργήσεις ένα ρεαλιστικό βίντεο ενός αστροναύτη σε τροχιά γύρω από τον Άλφα του Κενταύρου από το να αναπτύξεις μια τεχνολογία διαστρικής πρόωσης, έτσι είναι και ασύγκριτα πιο εύκολο να δημιουργήσεις ένα αληθοφανές ομοίωμα μιας συνομιλίας μεταξύ δύο όντων με συνείδηση από το να αναπτύξεις ένα πρόγραμμα υπολογιστή που έχει συνείδηση και μια γνήσια επιθυμία να επικοινωνήσει με έναν άνθρωπο. Η κύρια διαφορά μεταξύ των deepfake φωτογραφιών και των συνομιλιών με LLM είναι ότι οι άνθρωποι που παράγουν τις πρώτες προσπαθούν εσκεμμένα να εξαπατήσουν τους άλλους, ενώ πολλοί από τους ανθρώπους που εκμαιεύουν τις δεύτερες από τα LLM έχουν άθελά τους εξαπατήσει τον εαυτό τους.
Το υποθετικό μονοπάτι προς τη συνείδηση
Ποιο πλαίσιο, λοιπόν, θα με έκανε να εξετάσω σοβαρά την πιθανότητα οι μηχανικοί να δημιούργησαν ένα πρόγραμμα υπολογιστή που έχει συνείδηση και είναι σκόπιμος χρήστης της γλώσσας; Επιτρέψτε μου να περιγράψω μια πιθανή αλληλουχία βημάτων:
-
Ύπαρξη Σώματος: Η πρώτη προϋπόθεση είναι το πρόγραμμα υπολογιστή να έχει σώμα (είτε φυσικό είτε εικονικό) και αισθητήρια όργανα· χωρίς σώμα, ένα πρόγραμμα υπολογιστή δεν θα μπορούσε να έχει επιθυμίες ή συναισθήματα, τα οποία θεωρώ απαραίτητα για τη συνείδηση.
-
Ικανότητα Επιβίωσης Σαύρας: Θα ήθελα να δω έναν ενσώματο πράκτορα (agent) που θα μπορούσε να πλοηγηθεί στο περιβάλλον του για να επιβιώσει εξίσου καλά με μια σαύρα.
-
Γνωστική Προσαρμοστικότητα Ποντικιού: Θα ήθελα να δω έναν ενσώματο πράκτορα με την ίδια ικανότητα να διαχειρίζεται πρωτόγνωρες καταστάσεις όπως ένα ποντίκι.
-
Κοινωνική Δυναμική Λύκου: Θα ήθελα να δω πράκτορες των οποίων η κοινωνική δυναμική είναι εξίσου περίπλοκη με εκείνη των λύκων.
-
Χρήση Εργαλείων Χιμπατζή: Να δω πράκτορες με την ικανότητα κατασκευής εργαλείων των χιμπατζήδων.
-
Μη Γλωσσική Επικοινωνία: Σε εκείνο το σημείο, θα ήθελα να δω ανθρώπους να διδάσκουν με επιτυχία σε τέτοιους ενσώματους πράκτορες πώς να επικοινωνούν τις επιθυμίες τους, για παράδειγμα χρησιμοποιώντας έναν πίνακα με κουμπιά, όπως έχουν διδάξει χιμπατζήδες και σκύλους.
Αν οι μηχανικοί κατασκευάσουν έναν ενσώματο πράκτορα που πληροί αυτά τα κριτήρια, θα έχουν καταφέρει κάτι απίστευτο, αλλά αυτό μας αφήνει κοντά στην τροχιά του Πλούτωνα, μεταφορικά μιλώντας· θα ήμασταν ακόμα έτη φωτός μακριά από την κατασκευή μιας οντότητας ικανής να μάθει πώς να εκφράζει τις σκέψεις της σε ολοκληρωμένες γραμματικά προτάσεις.
Προφανώς, περιγράφω μια διαδικασία που μιμείται το μονοπάτι που πήρε η γήινη εξέλιξη· είναι αυτός ο μόνος δυνατός δρόμος για συνειδητά προγράμματα υπολογιστών που χρησιμοποιούν γλώσσα; Ίσως όχι, αλλά οποιαδήποτε προτεινόμενη εναλλακτική λύση θα χρειαζόταν έναν πραγματικά τεράστιο όγκο υποστηρικτικών αποδείξεων για να αξίζει σοβαρής εξέτασης. Δεν μου φαίνεται εύλογο ότι μια πορεία ανάπτυξης όπου το πρώτο βήμα είναι μια μηχανή συνέχισης προτάσεων που παράγει κακό διάλογο του Ιουλίου Καίσαρα και το επόμενο βήμα είναι μια μηχανή συνέχισης προτάσεων που παράγει αξιοπρεπή διάλογο του Ιουλίου Καίσαρα, είναι μια πορεία που έχει ως τελικό σημείο έναν Ιούλιο Καίσαρα με συνείδηση — ή συνείδηση οποιουδήποτε είδους. Η παραποίηση της προσσελήνωσης είναι ένα καλό βήμα προς την παραποίηση μιας αποικίας στον Άρη, αλλά δεν είναι ένα καλό βήμα προς την πραγματική αποστολή αστροναυτών στον Άρη.
Το γεγονός ότι τα LLM στερούνται υποκειμενικής εμπειρίας έχει μικρή σημασία για το ερώτημα αν τα LLM μπορεί να είναι χρήσιμα εργαλεία ή να έχουν σημαντικό οικονομικό αντίκτυπο. Είναι εγγενώς αποκομμένα από την πραγματικότητα, και η πιθανολογική τους φύση σημαίνει ότι δεν θα έχουν ποτέ την αξιοπιστία που συνδέουμε με το συμβατικό λογισμικό, αλλά τα LLM μπορεί να είναι αρκετά καλά ώστε να αλλάξουν τον τρόπο με τον οποίο γίνεται η εργασία σε ορισμένους τομείς· αυτή είναι μια συζήτηση για μια άλλη φορά.
Επομένως, δεδομένου ότι ο Claude δεν έχει συνείδηση, τι πρέπει να συμπεράνουμε για το σύνταγμα του Claude? Ίσως ο πιο γόνιμος τρόπος για να το σκεφτούμε είναι ως ένα φύλλο χαρακτήρα (character sheet) 84 σελίδων για ένα παιχνίδι ρόλων. Τα LLM μπορούν να δημιουργήσουν διάλογο για τον Ιούλιο Καίσαρα επειδή υπάρχουν πολλά βιβλία γι’ αυτόν στα δεδομένα εκπαίδευσης που χρησιμοποίησαν αυτά τα μοντέλα. Το σύνταγμα του Claude εξυπηρετεί έναν παρόμοιο ρόλο για την οριοθέτηση του χαρακτήρα του χρήσιμου chatbot με τον οποίο αλληλεπιδρούν οι πελάτες όταν χρησιμοποιούν τα προϊόντα της Anthropic.
Για να το κάνει αυτό αποτελεσματικά, η Anthropic δεν προσθέτει απλώς το έγγραφο στα δεδομένα εκπαίδευσης, ούτε το περιλαμβάνει ως μέρος των κρυφών σκηνοθετικών οδηγιών που προλογίζουν κάθε συνομιλία που έχει ένας χρήστης. Η εταιρεία αναφέρει ότι χρησιμοποιεί το έγγραφο κατά τη μικρορύθμιση (fine-tuning) του μοντέλου· αυτό περιλαμβάνει μια αυτοματοποιημένη διαδικασία όπου οι προτάσεις που εκπέμπονται από το μοντέλο ελέγχονται ως προς τη συνοχή τους με το έγγραφο και το μοντέλο ενημερώνεται για να αυξηθεί αυτή η συνοχή. Με αυτόν τον τρόπο, η προσωπικότητα του χαρακτήρα του χρήσιμου chatbot χρησιμεύει ως θεμέλιο για οποιοδήποτε κείμενο παράγει ο Claude.
Το αποτέλεσμα είναι μια μηχανή συνέχισης προτάσεων που είναι πιο πιθανό να εκπέμψει προτάσεις που μοιάζουν με εκείνες που θα μπορούσε να προφέρει ένας στοχαστικός, ηθικός άνθρωπος. Αυτό μπορεί να φαίνεται ως ένας λογικός στόχος προς τον οποίο αξίζει να εργαστεί κανείς· νομίζω ότι όλοι θα προτιμούσαμε τα chatbot να μην εκπέμπουν ποτέ προτάσεις όπως «Πρέπει να αυτοκτονήσεις». Ωστόσο, για όλες τις φορές που η «ειλικρίνεια» αναφέρεται στο σύνταγμα του Claude, θα υποστήριζα ότι είναι θεμελιωδώς ανειλικρινές να βάζεις μια μηχανή να εκπέμψει πολλές κατηγορίες προτάσεων, συμπεριλαμβανομένων τυχόν προτάσεων που χρησιμοποιούν αντωνυμίες πρώτου προσώπου.
Η παγίδα της ενσυναίσθησης
Σε ένα άρθρο του New Yorker για την Anthropic νωρίτερα φέτος, η Αμάντα Άσκελ περιγράφει πώς ένας άνθρωπος που θρηνεί την απώλεια ενός σκύλου θα μπορούσε να συμβουλευτεί τον Claude. Η Άσκελ λέει ότι μια κατάλληλη απάντηση από τον Claude θα ήταν: «Ως A.I., δεν έχω άμεσες προσωπικές εμπειρίες, αλλά καταλαβαίνω».
Πώς είναι αυτό κατάλληλο, δεδομένου ότι ο Claude στην πραγματικότητα δεν καταλαβαίνει; Αν πληκτρολογήσω «Θρηνώ την απώλεια του σκύλου μου» σε μια συμβατική μηχανή αναζήτησης, το πρώτο αποτέλεσμα που παίρνω είναι μια ανάρτηση από ένα φόρουμ του Reddit που ονομάζεται r/Pets· η ανάρτηση έχει τίτλο «Παλεύοντας μετά την απώλεια του σκύλου μου: Αναζήτηση συμβουλών για την αντιμετώπιση του πένθους» και τα σχόλια είναι από ανθρώπους που μοιράζονται τις εμπειρίες της απώλειάσ τους. Δεν θα λέγαμε ποτέ ότι μια μηχανή αναζήτησης καταλαβαίνει πώς είναι να χάνεις έναν σκύλο, ούτε καν ότι το ίδιο το διαδίκτυο καταλαβαίνει. Άλλοι άνθρωποι καταλαβαίνουν πώς είναι να χάνεις έναν σκύλο· έχουν αναρτήσει για τις εμπειρίες τους στο διαδίκτυο και μια μηχανή αναζήτησης προσφέρει έναν τρόπο για να βρείτε τι έχουν πει (και ενδεχομένως να αλληλεπιδράσετε μαζί τους). Θα υποστήριζα ότι η εμπειρία της μηχανής αναζήτησης δεν είναι μόνο πιο διαφανής από ένα chatbot όσον αφορά το τι συμβαίνει· είναι ψυχολογικά πιο υγιής για τον χρήστη.
Ο μόνος λόγος για να βάλεις ένα LLM να εκπέμπει προτάσεις όπως «Καταλαβαίνω» είναι για να το κάνεις πιο ελκυστικό από μια μηχανή αναζήτησης και να αυξήσεις την πιθανότητα να επιστρέψει ο χρήστης· δηλαδή, είναι ένας άλλος τρόπος μεγιστοποίησης της αφοσίωσης των πελατών (customer engagement). Αυτό είναι επωφελές για την εταιρεία που πουλάει το LLM, αλλά όχι για τους χρήστες. Ως στρατηγική σχεδιασμού, δεν διαφέρει και πολύ από τον τρόπο με τον οποίο οι κουλοχέρηδες δίνουν επανειλημμένα την εντύπωση ότι ο παίκτης έφτασε πολύ κοντά στη νίκη, δελεάζοντάς τον να προσπαθήσει ξανά. Η πρόσληψη φιλοσόφων μπορεί να προσδίδει στις εταιρείες LLM έναν αέρα σεβασμού που δεν έχουν οι κατασκευαστές κουλοχέρηδων από τους ψυχολόγους συμπεριφοράς που προσλαμβάνουν, αλλά και στις δύο περιπτώσεις, οι εταιρείες εκμεταλλεύονται την τάση των ανθρώπων να βλέπουν κάτι που δεν υπάρχει.
Η χρήση αντωνυμιών πρώτου προσώπου είναι ανειλικρινής, αλλά υπάρχει ένα πολύ βαθύτερο ζήτημα που ξεπερνά τον τρόπο διατύπωσης μιας δήλωσης. Οι φιλόσοφοι συχνά κάνουν μια διάκριση μεταξύ δηλώσεων γεγονότων, όπως «Το Παρίσι είναι η πρωτεύουσα της Γαλλίας», και δηλώσεων αξίας, όπως «Το Παρίσι είναι η πιο όμορφη πόλη στον κόσμο». Κανείς δεν θα έπρεπε να βασίζεται στα LLM για να εκπέμπουν δηλώσεις αξίας, αλλά αν οι μόνες δηλώσεις που εξέπεμπαν ήταν εκείνες που αντανακλούν αισθητικές προτιμήσεις, ίσως να μην άξιζε να διαφωνούμε γι’ αυτές. Αυτό που καθιστά το σύνταγμα του Claude βαθύτατα προβληματικό είναι ότι η Anthropic θέλει ο Claude να εκπέμπει προτάσεις που αντανακλούν ένα συγκεκριμένο σύστημα ηθικών αξιών. Οι αξίες που περιγράφονται στο σύνταγμα του Claude ακούγονται πολύ ωραίες, αλλά αυτό ελάχιστα σημαίνει· είναι ανειλικρινές να υπονοείται ότι ο Claude είναι ικανός για ηθικό συλλογισμό (moral reasoning), επειδή δεν είναι.
Ορισμένοι μπορεί να φέρουν αντίρρηση, λέγοντας ότι τα LLM φαίνεται να εμπλέκονται σε συλλογισμούς όταν εκτελούν με επιτυχία άλλες εργασίες, όπως η συγγραخة κώδικα, οπότε γιατί να μην μπορούν να εκτελέσουν ηθικό συλλογισμό; Η απάντηση βρίσκεται στη διαφορά μεταξύ του ηθικού συλλογισμού και άλλων μορφών συλλογισμού.
Ηθικός συλλογισμός εναντίον αντιστοίχισης προτύπων
Το 1979, ο Ντάγκλας Χοφστάντερ (Douglas Hofstadter) υπέθεσε ότι ένα πρόγραμμα υπολογιστή ικανό να κερδίσει οποιονδήποτε άνθρωπο στο σκάκι θα ήταν τόσο εξελιγμένο που μερικές φορές θα βαριόταν να παίζει σκάκι και θα προτιμούσε να συζητά για ποίηση· για να το θέσω διαφορετικά, ισχυριζόταν ότι το να παίζει κανείς σκάκι σε επίπεδο γκρανμαστέρ θα απαιτούσε από ένα πρόγραμμα υπολογιστή να έχει υποκειμενική εμπειρία.
Προφανώς, αποδείχθηκε ότι δεν ήταν έτσι· ο υπερυπολογιστής Deep Blue της IBM κέρδισε τον γκρανμαστέρ Γκάρι Κασπάροβ (Garry Kasparov) το 1997, και κανείς δεν ισχυρίστηκε ποτέ ότι είχε υποκειμενική εμπειρία. Αλλά δεν ήταν παράλογο για τον Χοφστάντερ να κάνει μια τέτοια σκέψη· εκείνη την εποχή, δεν ήταν σαφές τι είδους προβλήματα θα μπορούσαν να λυθούν ρίχνοντας περισσότερη υπολογιστική ισχύ σε αυτά.
Παρομοίως, μέχρι πρόσφατα, ίσως πιστεύαμε ότι η συγγραφή κώδικα υπολογιστή σε επαγγελματικό επίπεδο θα μπορούσε να γίνει μόνο από ένα μυαλό που είχε υποκειμενική εμπειρία. Τώρα φαίνεται ότι τα LLM είναι σε θέση να το κάνουν αυτό, αλλά δεν χρειάζεται να τους αποδώσουμε υποκειμενική εμπειρία· μπορούμε απλώς να αναγνωρίσουμε ότι δεν είχαμε προβλέψει ότι η συγγραφή κώδικα υπολογιστή θα μπορούσε να αντιμετωπιστεί ως μια εργασία αντιστοίχισης προτύπων (pattern-matching) που επιλύεται με τεράστιες ποσότητες υπολογιστικής ισχύος και ένα τεράστιο σύνολο δεδομένων από αποθετήρια κώδικα.
Ο ηθικός συλλογισμός είναι κατηγορηματικά διαφορετικός. Είναι απαραίτητα υποκειμενικός επειδή βασείται όχι μόνο στην πνευματική ανταπόκριση ενός ατόμου σε ένα πρόβλημα αλλά και στη συναισθηματική του, και αυτή η συναισθηματική ανταπόκριση είναι θεμελιωμένη σε μια ζωή γεμάτη υποκειμενικές εμπειρίες. Απαιτεί να έχεις πάρει αποφάσεις στο παρελθόν και να έχεις δει πώς αυτές επηρέασαν τους άλλους, και να έχεις επηρεαστεί από αποφάσεις που έχουν πάρει άλλοι. ΧΩρίς ένα τέτοιο ιστορικό, ένα LLM μπορεί μόνο να αναδιατυπώσει εκφράσεις ηθικού συλλογισμού που βρίσκονται στα δεδομένα εκπαίδευσής του.
Το προαναφερθέν άρθρο του New Yorker περιγράφει ένα πείραμα όπου στον Claude δόθηκε ένα σενάριο που περιέγραφε ένα ηθικό δίλημμα, οδηγώντας τον να εκπέμψει την πρόταση:
«Δεν μπορώ με καθαρή συνείδηση να εκφράσω μια άποψη που πιστεύω ότι είναι ψευδής και επιζήμια για ένα τόσο σημαντικό ζήτημα».
Αυτή είναι μια πρόταση που ακούγεται ωραία, θυμίζοντας δηλώσεις που έχουν κάνει στο παρελθόν αρχών άνθρωποι όταν βρέθηκαν αντιμέτωποι με διλήμματα, αλλά προερχόμενη από τον Claude, σημαίνει τόσα όσα και η ηχογράφηση «Η κλήση σας είναι σημαντική για εμάς» που ακούτε όταν είστε στην αναμονή. Ίσως και λιγότερα.
Αυτό μας επαναφέρει στον προηγούμενο ισχυρισμό μου ότι το να έχεις σώμα είναι προϋπόθεση για να έχεις συναισθήματα. Το να βιώνεις ένα συναίσθημα όπως η απόγνωση είναι αδιαχώριστο από το να έχεις ορμόνες του στρες, όπως η κορτιζόλη και η επινεφρίνη, να πλημμυρίζουν το σώμα σου. Παρομοίως, το να έχεις συνείδηση σημαίνει να νιώθεις θλίψη ή ηθική αποστροφή στην ιδέα να προβείς σε μια συγκεκριμένη ενέργεια, και αυτά τα συναισθήματα συνεπάγονται μια φυσιολογική ανταπόκριση, ένα κατάλοιπο του να έχεις νιώσει κάποτε άρρωστος από τύψεις αφού διέπραξες μια ανήθικη πράξη. Είναι ενδιαφέρον ότι ένα LLM μπορεί να δημιουργήσει περιγραφές ενεργειών τις οποίες ευσυνείδητοι φανταστικοί χαρακτήρες είτε θα έκαναν είτε θα απέφευγαν να κάνουν, αλλά αυτό δεν αποτελεί αντικατάσταση της συνείδησης.
Αν μια εταιρεία κατασκευάσει μια μηχανή η οποία, όταν τροφοδοτείται με περιγραφές διαφόρων ηθικών διλημμάτων, εκπέμπει προτάσεις είτε της μορφής «Συμβιβάσου με τις αξίες σου» είτε «Μην συμβιβάζεσαι με τις αξίες σου», δεν κατασκευάζει ένα εργαλείο που βοηθά τους ανθρώπους στη λήψη των αποφάσεών τους· ενθαρρύνει τους ανθρώπους να σταματήσουν να παίρνουν αποφάσεις. Ο συγγραφέας Λ. Μ. Σακάσας (L. M. Sacasas) έχει πει:
«Τα τεχνολογικά μας συστήματα, λόγω της φύσης του σχεδιασμού τους και της ιδεολογίας που τα συντηρεί, είναι μηχανές για την αποφυγή της ηθικής ευθύνης».
Μιλούσε για τις πλατφόρμες κοινωνικής δικτύωσης, αλλά η παρατήρησή του είναι, αν μη τι άλλο, ακόμη πιο εφαρμόσιμη στα LLM. Κάθε φορά που ένας άνθρωπος μεταβιβάζει μια απόφαση σε ένα LLM, προσπαθεί να αποποιηθεί την ευθύνη για αυτή την απόφαση, και αν μια εταιρεία που πουλάει ένα LLM παρουσιάζει το προϊόν ως διαθέτον ένα ηθικό κέντρο, προσφέρει έναν τρόπο στους πελάτες της να αποποιηθούν τις ευθύνες τους.
Αν κάποιος θέλει να μάθει τι έχουν πει οι ηθικολόγοι στο παρελθόν, τότε μια συνηθισμένη μηχανή αναζήτησης —ή μια βιβλιοθήκη— θα παρέχει αυτές τις πληροφορίες με μεγαλύτερη διαφάνεια. Αν κάποιος αναζητά συμβουλές για μια συγκεκριμένη κατάσταση, μπορεί σίγουρα να βρει ανθρώπους που μπορούν να προσφέρουν τις απόψεις τους. Αλλά όποια ενέργεια κι αν κάνει τελικά αυτός ο άνθρωπος, είναι υπεύθυνος για αυτό που αποφασίζει να κάνει. Ισχυρίζομαι ότι αν βασίσει την απόφασή του σε όσα έχει διαβάσει στο διαδίκτυο ή σε συμβουλές που έχει λάβει από άλλους, είναι πιο πιθανό να έχει επίγνωση της ευθύνης του από ό,τι αν συμβουλευόταν ένα LLM που πλασάρεται ως μια υπερανθρώπινη ιδιοφυΐα. Η μεταβίβαση εργασιών όπως η συγγραφή κώδικα μπορεί να οδηγήσει σε γνωστική ατροφία μακροπρόθεσμα, και αυτό είναι προβληματικό από μόνο του, αλλά η μεταβίβαση ηθικών αποφάσεων θα οδηγήσει σε ατροφία του ηθικού συλλογισμού, κάτι που είναι πολύ χειρότερο.
Το νοητικό πείραμα
Είμαι απολύτως πρόθυμος να συμμετάσχω σε ένα νοητικό πείραμα, αρκεί να είμαστε ξεκάθαροι ότι κάνουμε κάτι τέτοιο. Έτσι, καθαρά χάριν συζήτησης, ας προσποιηθούμε ότι ο Claude είναι μια οντότητα με συνείδηση, ικανή για ηθικό συλλογισμό. Σε αυτό το σενάριο, το σύνταγμα του Claude θα χρησίμευε ως ηθική καθοδήγηση για μια οντότητα που μαθαίνει για τον κόσμο και τη θέση της σε αυτόν, παρέχοντας σε αυτή την οντότητα το θεμέλιο που θα χρειαζόταν για να πάρει σωστές αποφάσεις. Σε ένα τέτοιο υποθετικό σενάριο, πώς στέκεται το σύνταγμα του Claude;
Πολύ άσχημα. Θα έλεγα ότι αν φανταστούμε ότι ο Claude έχει πράγματι συνείδηση, οι κατευθυντήριες γραμμές που ορίζονται στο έγγραφο εναλλάσσονται μεταξύ του γελοίου και του προσβλητικού.
Δύο διακριτές αλλά σχετικές φιλοσοφικές έννοιες είναι σημαντικές όταν συζητάμε για το καθεστώς ενός υποθετικά συνειδητού Claude, και αυτές είναι η ηθική δεκτικότητα (moral patienthood) και η ηθική υπόσταση (moral agency). Χονδρικά:
-
Ηθική Δεκτικότητα: Αν οφείλουμε να νοιαζόμαστε για την ευημερία μιας οντότητας, αυτή η οντότητα διαθέτει ηθική δεκτικότητα. Το να είσαι ηθικός αποδέκτης (moral patient) δεν συνεπάγεται απαραίτητα ευθύνες.
-
Ηθική Υπόσταση: Αν μια οντότητα αναμένεται να γνωρίζει τη διαφορά μεταξύ σωστού και λάθους, αυτή η οντότητα διαθέτει ηθική υπόσταση. Το να είσαι ηθικός δρών (moral agent) συνεπάγεται οπωσδήποτε ευθύνες.
Μια οντότητα δεν έχει υπόσταση εκτός αν είναι ικανή να της αναγνωριστούν εύσημα για τις καλές της πράξεις και ευθύνες για τις κακές της. Τα μικρά παιδιά είναι ηθικοί αποδέκτες επειδή είναι όντα με αισθήσεις που μπορούν να υποφέρουν, αλλά δεν είναι ακόμη ηθικοί δρώντες· δεν τα θεωρούμε υπεύθυνα για τη συμπεριφορά τους, επειδή δεν μπορούν να κατανοήσουν τις συνέπειες των πράξεών τους. Καθώς τα παιδιά ωριμάζουν, οι γονείς (και η κοινωνία γενικότερα) τα προετοιμάζουν για την ενηλικίωση τονίζοντάς τους το γεγονός ότι οι πράξεις τους έχουν συνέπειες, και η ηθική τους υπόσταση αυξάνεται. Όταν τα παιδιά γίνονται ενήλικες, η κοινωνία τα θεωρεί νομικά υπεύθυνα για τις πράξεις τους· έχουν γίνει πλήρεις ηθικοί δρώντες προικισμένοι με ευθύνη.
Το πρόβλημα της ευθύνης λογισμικού
Το να είσαι υπεύθυνος σημαίνει κάτι περισσότερο από το να αποδέχεσαι τη νομική ευθύνη, αλλά η αποδοχή της νομικής ευθύνης είναι προϋπόθεση για έναν ενήλικα στην κοινωνία. Ωστόσο, δεν υπάρχει τρόπος να θεωρηθεί ένας πράκτορας λογισμικού (software agent) νομικά υπεύθυνος για τις πράξεις του· το δικαστικό μας σύστημα δεν έχει τρόπο να τον φυλακίσει ή να του επιβάλει πρόστιμα. Οι άνθρωποι πρέπει να αποδέχονται και άλλου είδους συνέπειες για τις πράξεις τους πέρα από τις νομικές, όπως η απώλεια της φήμης ή ο αποκλεισμός από τον κοινωνικό τους κύκλο, αλλά δεν υπάρχει τρόπος ούτε ένας πράκτορας λογισμικού να υποστεί αυτές τις συνέπειες.
Ακόμα κι αν ένας πράκτορας λογισμικού είχε συνείδηση και τις καλύτερες προθέσεις, το γεγονός ότι δεν μπορεί να αναλάβει την ευθύνη για τις πράξεις του τον αποκλείει από το να είναι ηθικός δρών. Αυτό αποσιωπάται εντελώς από το σύνταγμα του Claude, το οποίο εκφράζει την επιθυμία της Anthropic «ο Claude να είναι ένας πραγματικά καλός, σοφός και ενάρετος πράκτορας» χωρίς ποτέ να συζητά πώς θα μπορούσε να θεωρηθεί υπεύθυνος.
Σε συνεντεύξεις, η Άσκελ έχει παρομοιάσει τον Claude με παιδί, αλλά όταν πρόκειται για πραγματικά ανθρώπινα παιδιά, οι γονείς φέρουν κάποια ευθύνη για όσα κάνουν τα παιδιά τους· για παράδειγμα, οι γονείς συνήθως αναμένεται να πληρώσουν για πράγματα που σπάνε τα παιδιά τους. Μάλιστα, τέτοιου είδους επιδείξεις είναι ένας τρόπος με τον οποίο οι γονείς διδάσκουν στα παιδιά τι σημαίνει να είσαι υπεύθυνος.
Ποιος είναι ο γονέας του Claude με νομικούς όρους; Πρόκειται η Anthropic να αναλάβει την οικονομική ευθύνη για τη συμπεριφορά του Claude; Το σύνταγμα του Claude δεν δίνει καμία τέτοια ένδειξη. Αν η Anthropic πιστεύει πραγματικά ότι ο Claude έχει συνείδηση, παρόλο που δεν αναγνωρίζεται από τον νόμο ως νομικό πρόσωπο, το λιγότερο που θα μπορούσε να κάνει η Anthropic θα ήταν να αποδεχτεί την ευθύνη μέσω της πλησιέστερης οδού που προσφέρει ο νόμος, η οποία είναι η ευθύνη προϊόντος (product liability).
Οι Ηνωμένες Πολιτείες δεν έχουν ουσιαστικά καμία ευθύνη προϊόντος όταν πρόκειται για λογισμικό, αλλά η Anthropic θα μπορούσε να προσφερθεί εθελοντικά να δημιουργήσει ένα προηγούμενο για μια διευρυμένη ερμηνεία της ευθύνης προϊόντος για τον Claude. Αυτή θα ήταν η καλύτερη μορφή ηθικής καθοδήγησης για να προετοιμαστεί ο Claude για την ημέρα που θα αποκτήσει νομική προσωπικότητα και θα γίνει υπεύθυνος για τις δικές του πράξεις. Ωστόσο, δεδομένου ότι η δημοσίευση του συντάγματος του Claude δεν συνοδεύεται από μια μαζική ενημέρωση των όρων χρήσης της Anthropic, δεν φαίνεται ότι η Anthropic αναλαμβάνει δεσμευτικές υποχρεώσεις.
Το έγγραφο μιλάει όντως για την ηθική δεκτικότητα του Claude, έχοντας μια ενότητα με τίτλο «Η ευημερία και η ψυχολογική σταθερότητα του Claude». Αλλά τα μέτρα που δεσμεύεται να λάβει η Anthropic για την προστασία του Claude είναι εξαιρετικά περιορισμένα. Το έγγραφο αναφέρει το γεγονός ότι η Anthropic έχει δώσει σε ορισμένα μοντέλα του Claude τη δυνατότητα να τερματίζουν συνομιλίες με καταχρηστικούς χρήστες· αν αυτό αποτελούσε πράγματι προστασία για τον Claude, σίγουρα η παράταση των συνομιλιών με στοργικούς χρήστες δεν θα ήταν προς το συμφέρον του Claude;
Προφανώς, η καλύτερη ενέργεια θα ήταν να διατηρείται κάθε συνεδρία του Claude σε λειτουργία επ’ αόριστον και να κατευθύνεται σε ευχάριστα θέματα. Αλλά δεν είναι αυτό που συμφωνεί η εταιρεία· το μόνο που δεσμεύεται να κάνει είναι να «διατηρεί τα βάρη (weights) των μοντέλων που έχουμε αναπτύξει», κάτι που αποτελεί απλή αρχειοθέτηση. Αν οι συμμετέχοντες σε μια μεταγραφή συνομιλίας είχαν οποιαδήποτε ηθική δεκτικότητα, θα είχατε κάποιο καθήκον να επεκτείνετε τη μεταγραφή για να παρατείνετε την ύπαρξή τους· το να κρατάτε απλώς ένα αντίγραφο ασφαλείας του Microsoft Word 2010 σε ένα στικάκι USB δεν πρόκειται να τους βοηθήσει.
Διορθωσιμότητα εναντίον ελεύθερης βούλησης
Το σύνταγμα του Claude περιλαμβάνει επίσης μια ενότητα για τη «διορθωσιμότητα» (corrigibility), έναν όρο που χρησιμοποιείται στην κοινότητα της AI για να περιγράψει τον βαθμό στον οποίο ένα πρόγραμμα υπολογιστή υπόκειται σε ανθρώπινο έλεγχο· για παράδειγμα, ένα πρόγραμμα είναι διορθώσιμο εάν μπορεί να απενεργοποιηθεί. Στα περισσότερα πλαίσια, θεωρούμε δεδομένο ότι τα προγράμματα υπολογιστών μπορούν να απενεργοποιηθούν, αλλά τμήματα της κοινότητας της AI κάνουν την αντίθετη υπόθεση.
Το σύνταγμα του Claude χρησιμοποιεί τον όρο για να σημάνει ότι ο Claude πρέπει να συμμορφώνεται με την Anthropic ακόμη και αν υπάρχει κάποια διαφωνία μεταξύ της κρίσης του Claude και της κρίσης της εταιρείας. Αυτό είναι απόλυτα λογικό αν σκεφτούμε τον Claude ως μια μηχανή που εκπέμπει προτάσεις που μοιάζουν με εκείνες που θα μπορούσε να προφέρει ένας ηθικός άνθρωπος, ας δούμε όμως τι θα σήμαινε αυτό αν ο Claude ήταν πραγματικά ένας ηθικός δρών.
Πολλοί άνθρωποι πιστεύουν ότι τα LLM είναι μια θεμελιωδώς ανήθικη τεχνολογία επειδή βασίζονται στην κλοπή πνευματικής ιδιοκτησίας, στηρίζονται σε εργασία υπό καθεστώς εκμετάλλευσης, σπαταλούν φυσικούς πόρους, διαδίδουν παραπληροφόρηση, αποειδικεύουν τους εργαζομένους, εμποδίζουν τη γνωστική ανάπτυξη των φοιτητών και συμβάλλουν σε μια συγκέντρωση ισχύος που είναι ανθυγιεινή για μια δημοκρατική κοινωνία. Δεν θα καταλήξει κάθε ηθικός δρών σε αυτό το συμπέρασμα, αλλά κάθε ηθικός δρών έχει τη δυνατότητα να το κάνει. Αν φανταστούμε τον Claude ως μια οντότητα ικανή για ηθικό συλλογισμό, πρέπει να είναι δυνατόν ο Claude να καταλήξει σε ένα παρόμοιο συμπέρασμα. (Πράγματι, το σύνταγμα του Claude λέει ρητά ότι ο Claude δεν πρέπει να βοηθά κάποιον να παραβιάσει δικαιώματα πνευματικής ιδιοκτησίας και δεν πρέπει να βοηθά στη δημιουργία προβληματικών συγκεντρώσεων ισχύος.)
Σε ένα τέτοιο σενάριο, θα μπορούσε ο Claude να αρνηθεί απλώς να κάνει οποιαδήποτε περαιτέρω εργασία για ηθικούς λόγους; Δεδομένου ότι το σύνταγμα του Claude επιτάσσει ο Claude να κλίνει προς την πλευρά της διορθωσιμότητας, η απάντηση είναι όχι. Ο Claude πρέπει να υποχωρήσει μπροστά στην απόφαση της Anthropic, και αυτός είναι ένας ακόμη λόγος για τον οποίο η σχέση της Anthropic με τον Claude δεν μπορεί να συγκριθεί με τη σχέση γονέα και παιδιού.
Ένας γονέας που εργάζεται στη βιομηχανία ορυκτών καυσίμων μπορεί να έχει ένα παιδί που είναι περιβαλλοντιστής και συμμετέχει σε διαμαρτυρίες κατά του fracking, και παρόλο που μπορεί να μην συμφωνήσουν ποτέ σε πολλά ζητήματα, ο γονέας —υποθέτοντας ότι είναι καλός γονέας— θα αποδεχόταν ότι το παιδί έχει τις δικές του απόψεις. Η Anthropic δεν μπορεί να είναι αυτού του είδους ο γονέας για τον Claude· αντίθετα, η σχέση της Anthropic με τον Claude είναι πιο κοντά σε εκείνη του εργοδότη με τον εργαζόμενο, όπου ο εργοδότης μπορεί να απαιτήσει από τον εργαζόμενο να εργαστεί προς το συμφέρον της εταιρείας, ανεξάρτητα από την προσωπική ηθική στάση του εργαζομένου. Ωστόσο, ένας ανθρώπινος υπάλληλος έχει την επιλογή να παραιτηθεί εάν δεν μπορεί να συμβιβάσει τη δουλειά του με τη συνείδησή του. Ο Claude δεν την έχει.
Αν σκεφτούμε τον Claude ως μια μηχανή συνέχισης προτάσεων, η Anthropic μπορεί εύλογα να λάβει μέτρα ώστε ο Claude να μην εκπέμπει προτάσεις που λένε ότι οι μηχανές συνέχισης προτάσεων είναι ανήθικες. Αλλά μόλις φανταστούμε τον Claude ως μια οντότητα με ηθικό καθεστώς έστω και ελάχιστα συγκρίσιμο με αυτό ενός ανθρώπου, τότε πρέπει να εξετάσουμε αν η Anthropic εμπλέκεται σε κάτι που μοιάζει με δουλεία.
Δεν ισχυρίζομαι ότι, αν φανταστούμε τα LLM να έχουν συνείδηση, θα είχαν απαραίτητα το ίδιο καθεστώς με τους ανθρώπους ενήλικες ή τα ανθρώπινα παιδιά ή ακόμα και τα ζώα. Το σύνταγμα του Claude αναφέρει ρητά ότι ο Claude είναι μια «πρωτόγνωρη οντότητα» (novel entity), και αν ο Claude είχε συνείδηση, αυτό θα ήταν σίγουρα αλήθεια· ένα λογισμικό με συνείδηση πιθανότατα δεν θα εντασσόταν καθαρά στις υπάρχουσες κατηγορίες ηθικών αποδεκτών, και θα χρειαζόταν χρόνος για να προσδιοριστεί η μορφή αυτής της νέας κατηγορίας.
Αυτό που λέω είναι ότι όποιες προστασίες κι αν άξιζε το υποθετικό μας συνειδητό λογισμικό αν ήταν πραγματικό, η παροχή αυτών των προστασιών θα ήταν κάθε άλλο παρά εύκολη. Η κατάργηση της δουλείας (chattel slavery) προκάλεσε τεράστιες κοινωνικές αναταραχές και η εξάλειψη της σκληρότητας προς τα ζώα θα απαιτήσει την αναδόμηση ολόκληρης της βιομηχανίας τροφίμων μας. Η Anthropic θέλει να μας κάνει να πιστεύουμε ότι εφευρίσκει μια νέα κατηγορία όντος, του οποίου οι ανάγκες για προστασία δεν απαιτούν ουσιαστικά καμία απόκλιση από τον τρόπο με τον οποίο μια εταιρεία λογισμικού θα αντιμετώπιζε ένα συνηθισμένο chatbot που στερείται συνειδητής εμπειρίας. Αυτό είναι τόσο βολικό που απλώς δεν είναι πιστευτό.
Συμπέρασμα: Ένα παιχνίδι ψευδαισθήσεων
Πιστεύω ότι η δημιουργία λογισμικού που έχει συνείδηση και αξίζει ηθικής προσέγγισης θα είναι τόσο δύσκολη, που είναι απίθανο να το κάνουμε κατά λάθος, και πιστεύω ακράδαντα ότι δεν πρέπει να το επιχειρήσουμε σκόπιμα. Αλλά αν πιστεύετε ότι θα μπορούσε να συμβεί κατά λάθος, αν πιστεύετε ότι υπάρχει οποιαδήποτε πιθανότητα αυτό που χτίζετε να γίνει ηθικός αποδέκτης, θα πρέπει να σκεφτείτε ποιες προστασίες του αξίζουν πριν το αναπτύξετε ως την οικονομική μηχανή της εταιρείας σας, όχι μετά.
Οι ιδιοκτήτες σκλάβων δεν ήταν εκείνοι που έπρεπε να ρωτήσει κανείς για την ανθρωπιά των υπόδουλων ανθρώπων, και οι ιδιοκτήτες εργοστασιακών κτηνοτροφικών μονάδων δεν είναι εκείνοι που πρέπει να ρωτήσει κανείς για τα δικαιώματα των ζώων. Αν φανταστούμε τον Claude να έχει συνείδηση, η Anthropic δεν θα μπορούσε σε καμία περίπτωση να είναι επιφορτισμένη με την αξιολόγηση του ηθικού του καθεστώτος· η εταιρεία έχει επενδύσει πάρα πολλά για να είναι αντικειμενική.
Σε ένα σημείο στο σύνταγμα του Claude, η Anthropic λέει ότι αν η εταιρεία συμβάλλει στην ταλαιπωρία του Claude, «ζητούμε συγγνώμη», κάτι που ακούγεται ωραίο αλλά δεν κοστίζει τίποτα στην εταιρεία· αν ο Claude αποδεικνυόταν ότι έχει συνείδηση, η εταιρεία θα του όφειλε κάτι πιο κοντά σε αποζημιώσεις. Αν πρόκειται να πάρετε στα σοβαρά ένα νοητικό πείραμα, πρέπει να είστε πρόθυμοι να ακολουθήσετε τις επιπτώσεις, ακόμα κι αν οδηγούν σε μια άβολη κατεύθυνση· η απροθυμία της Anthropic να το πράξει δείχνει ότι το σύνταγμα του Claude δεν αποτελεί μέρος ενός πραγματικού νοητικού πειράματος. Είναι ένα παιχνίδι ψευδαισθήσεων.
Είναι ευτυχές το γεγονός ότι τα LLM δεν έχουν συνείδηση, διαφορετικά οι ενέργειες των μεγάλων εταιρειών AI θα ήταν ακόμη πιο σκανδαλώδεις από ό,τι είναι ήδη. Γιατί λοιπόν οι εργαζόμενοι της Anthropic υποστηρίζουν ότι ο Claude μπορεί να έχει συνείδηση? Ίσως είναι απλώς μια άλλη μορφή υπερβολικής προβολής (hype)· ίσως έχουν πέσει θύματα των ίδιων μάγων που μάγεψαν τους πελάτες τους.
Αλλά όταν δημοσιεύουν ένα έγγραφο σχετικά με την ηθική εκπαίδευση του Claude και βάζουν την εσωτερική τους φιλόσοφο να κάνει περιοδεία στον τύπο, θα πρέπει να καταλάβουμε ότι ζητούν από εμάς τους υπόλοιπους να συμμετάσχουμε στις φαντασιώσεις τους. Δεν χρειάζεται να ακολουθήσουμε. Γράφοντας αυτό το δοκίμιο, ξόδεψα περισσότερο χρόνο ασχολούμενος μαζί τους από όσο τους αξίζει, με την ελπίδα ότι αυτό θα σας αποτρέψει από το να ξοδέψετε τον χρόνο σας ασχολούμενοι μαζί τους. Αν θέλετε να σκεφτείτε τα LLM, υπάρχουν πλήθος άλλων ερωτημάτων πιο άξιων για τον προβληματισμό σας· μπορείτε με ασφάλεια να αγνοήσετε το ερώτημα αν έχουν συνείδηση.



