Η Anthropic καλεί τα μεγάλα εργαστήρια τεχνητής νοημοσύνης να εξετάσουν μια συντονισμένη και επαληθεύσιμη παύση στην ανάπτυξη, προειδοποιώντας ότι οι ραγδαίες πρόοδοι στην τεχνολογία θα μπορούσαν σύντομα να επιτρέψουν στα συστήματα AI να αυτοβελτιώνονται ταχύτερα από ό,τι μπορεί η κοινωνία να διαχειριστεί τους κινδύνους.
Η δημιουργός του Claude δήλωσε ότι η ικανότητα της AI να ολοκληρώνει εργασίες από μόνη της διπλασιάζεται περίπου κάθε τέσσερις μήνες και ότι οδεύει προς μια «αναδρομική αυτοβελτίωση» (recursive self-improvement), το σημείο δηλαδή στο οποίο η τεχνολογία μπορεί να βελτιώνεται χωρίς ανθρώπινη παρέμβαση.
«Εάν τα συστήματα είναι ικανά να κατασκευάζουν πλήρως τους δικούς τους διαδόχους, οι τρόποι με τους οποίους τα ασφαλίζουμε, τα παρακολουθούμε και διαμορφώνουμε τη συμπεριφορά τους αποκτούν πολύ μεγαλύτερη σημασία», ανέφερε η νεοφυής εταιρεία (startup) σε μια εκτενή ανάρτηση στο ιστολόγιό της την Πέμπτη, προσθέτοντας ότι μια παύση θα επέτρεπε στην κοινωνία να «διαχειριστεί τις τεράστιες επιπτώσεις της».
«Δεν έχουμε φτάσει ακόμα εκεί, και η αναδρομική αυτοβελτίωση δεν είναι αναπόφευκτη. Αλλά θα μπορούσε να έρθει νωρίτερα από ό,τι είναι προετοιμασμένοι οι περισσότεροι θεσμοί», έγραψαν στην ανάρτηση ο συνιδρυτής της Anthropic, Τζακ Κλαρκ (Jack Clark), και η επικεφαλής του Ινστιτούτου Anthropic (Anthropic Institute), Μαρίνα Φαβάρο (Marina Favaro).
Οι φόβοι ότι τα προηγμένα συστήματα AI ενδέχεται να ξεφύγουν από τον ανθρώπινη έλεγχο και να προκαλέσουν κοινωνική βλάβη έχουν αυξηθεί καθώς η τεχνολογία γίνεται ολοένα και πιο ικανή. Το ίδιο το μοντέλο Mythos της Anthropic προκάλεσε κλυδωνισμούς σε κλάδους όπως ο τραπεζικός τομέας και το λογισμικό νωρίτερα φέτος, με την ικανότητά του να εντοπίζει τρωτά σημεία σε υφιστάμενο κώδικα.
Ωστόσο, η θέσπιση ρυθμιστικών κανόνων καθυστερεί, ιδίως στις ΗΠΑ όπου εδρεύουν τα περισσότερα κορυφαία εργαστήρια AI. Ένα εκτελεστικό διάταγμα της κυβέρνησης Τραμπ νωρίτερα αυτή την εβδομάδα μετέφερε την ευθύνη στα ίδια τα εργαστήρια, ζητώντας τους να υποβάλουν εθελοντικά τα πιο ικανά μοντέλα τους για κυβερνητικές δοκιμές κυβερνοασφάλειας πριν από τη δημόσια κυκλοφορία τους.
Ερευνητές της AI έχουν ζητήσει παύση και στο παρελθόν, αλλά με μικρή επιτυχία. Ο Ίλον Μασκ (Elon Musk), στον οποίο ανήκει το εργαστήριο AI xAI, ήταν μεταξύ των υποστηρικτών μιας προσπάθειας το 2023 από τον μη κερδοσκοπικό οργανισμό Future of Life Institute για το πάγωμα της ανάπτυξης της AI για έξι μήνες, ώστε να δοθεί χρόνος για τη θέσπιση δικλείδων ασφαλείας.
Η Anthropic έχει τοποθετηθεί εδώ και καιρό ως ένα εργαστήριο AI εστιασμένο στην ασφάλεια. Νωρίτερα φέτος, αρνήθηκε να επιτρέψει στον στρατό των ΗΠΑ να χρησιμοποιήσει τα μοντέλα της για εγχώρια παρακολούθηση και πλήρως αυτόνομα όπλα, προκαλώντας την έντονη αντίδραση της κυβέρνησης, η οποία την έβαλε σε μια μαύρη λίστα εθνικής ασφάλειας, η οποία πρόκειται να τεθεί σε ισχύ αργότερα εντός του 2026.
Το πρακτορείο Reuters ανέφερε την Παρασκευή ότι η διαμάχη παρουσιάζει σημάδια αποκλιμάκωσης σε ορισμένα τμήματα της κυβέρνησης των ΗΠΑ.
Παρά ταύτα, η Anthropic συνέχισε να κυκλοφορεί ολοένα και πιο ισχυρά μοντέλα και τον Φεβρουάριο υπαναχώρησε από μια βασική δέσμευση ασφαλείας, δηλώνοντας ότι δεν θα κρατούσε πλέον πίσω μια δυνητικά επικίνδυνη AI εάν οι ανταγωνιστές της ήταν κοντά στο να εξισώσουν τις δυνατότητές της.
Πρόσφατα αποτιμήθηκε στα 965 δισεκατομμύρια δολάρια σε έναν τεράστιο γύρο χρηματοδότησης και τη Δευτέρα κατέθεσε εμπιστευτικά αίτηση για αρχική δημόσια προσφορά (IPO) στις ΗΠΑ, αφήνοντας πίσω την ανταγωνίστρια OpenAI τόσο σε αποτίμηση όσο και στην κούρσα για την εξασφάλιση κρίσιμων κεφαλαίων.
ΣΥΝΤΟΝΙΣΜΕΝΗ ΔΡΑΣΗ
Η ανάρτηση της Anthropic την Πέμπτη προειδοποίησε ότι οι μονομερείς ή κακώς συντονισμένες επιβραδύνσεις θα μπορούσαν να γυρίσουν μπούμερανγκ εάν λιγότερο προσεκτικοί δρώντες συνεχίσουν να σημειώνουν πρόοδο, μειώνοντας ενδεχομένως τη συνολική ασφάλεια.
Ανέφερε ότι μια ουσιαστική παύση θα απαιτούσε συμφωνία μεταξύ «πολλαπλών εργαστηρίων με επαρκείς πόρους» που δραστηριοποιούνται στην τεχνολογική αιχμή, καθώς και κανόνες για το ποιες συνθήκες θα ενεργοποιούσαν ή θα ήραν μια τέτοια παύση και ποιος θα την επέβλεπε.
«Μια μονομερής παύση από ένα μόνο εργαστήριο, αντίθετα, είναι εφικτή αμέσως, αλλά επιτυγχάνει πολύ λιγότερα: θα άλλαζε το ποιος είναι ο πρωτοπόρος, αλλά δεν θα δημιουργούσε την ευρύτερη διαδικασία διαβούλευσης που λείπει αυτή τη στιγμή», ανέφερε η νεοφυής εταιρεία.
Ο ερευνητικός της βραχίονας, το Anthropic Institute, σχεδιάζει να μελετήσει τα συστήματα που απαιτούνται για την υποστήριξη μιας επιβράδυνσης και τους επόμενους μήνες θα συγκαλέσει υπεύθυνους χάραξης πολιτικής, ερευνητές, ομάδες της κοινωνίας των πολιτών και ανταγωνιστικές εταιρείες AI για να συζητήσουν τη διαχείριση κινδύνων, όπως η αναδρομική αυτοβελτίωση.
Οι εταιρείες OpenAI, xAI, Alphabet, Meta Platforms και η γαλλική Mistral δεν ανταποκρίθηκαν αμέσως σε αιτήματα για σχολιασμό σχετικά με το αν θα συμμετάσχουν σε αυτό το κάλεσμα.
reuters.com



