Μια τυχαία διαρροή επιβεβαιώθηκε πλέον επίσημα από την εταιρεία τεχνητής νοημοσύνης Anthropic σχετικά με το ισχυρότερο μοντέλο AI της μέχρι σήμερα.
Το μοντέλο, πλέον γνωστό ως “Claude Mythos”, αποκαλύφθηκε αρχικά σε ρεπορτάζ του Fortune. Η Anthropic επιβεβαίωσε έκτοτε τις λεπτομέρειες σχετικά με τη διαρροή στο εν λόγω μέσο.
Η διαρροή δεδομένων περιελάμβανε λεπτομέρειες σχετικά με την επικείμενη κυκλοφορία του μοντέλου Claude Mythos AI, μια «αποκλειστική εκδήλωση για CEO» και άλλα εσωτερικά στοιχεία, όπως αρχεία PDF και εικόνες, σύμφωνα με το Fortune. Συνολικά, η διαρροή περιλάμβανε σχεδόν 3.000 στοιχεία που η Anthropic δεν είχε δημοσιεύσει προηγουμένως.
Λεπτομέρειες της διαρροής του Claude Mythos
Σύμφωνα με την Anthropic, η διαρροή ήταν αποτέλεσμα ενός προβλήματος στο σύστημα διαχείρισης περιεχομένου (CMS) που χρησιμοποιεί η εταιρεία. Τα δεδομένα ανέβηκαν στο CMS από την εταιρεία, ωστόσο η Anthropic παρέλειψε να επισημάνει τα στοιχεία ως ιδιωτικά, με αποτέλεσμα τα δεδομένα να αποθηκευτούν σε μια δημόσια προσβάσιμη «λίμνη δεδομένων» (data lake).
Ορισμένα από τα δεδομένα ήταν αχρησιμοποίητα στοιχεία από παλαιότερες ανακοινώσεις της Anthropic. Άλλα διερρεύσαντα δεδομένα ήταν εσωτερικές εταιρικές πληροφορίες, όπως στοιχεία εργαζομένων ή πληροφορίες για μια εκδήλωση για CEO μόνο με πρόσκληση. Επίσης, στα διερρεύσαντα δεδομένα βρέθηκαν πληροφορίες για το Claude Mythos σε ένα προσχέδιο μη δημοσιευμένης ανάρτησης ιστολογίου.
Claude Mythos και Capybara
Σύμφωνα με το διερρευσαν προσχέδιο για το Claude Mythos, η Anthropic έχει ολοκληρώσει την εκπαίδευση του μοντέλου και αναφέρεται σε αυτό ως «μακράν το ισχυρότερο μοντέλο τεχνητής νοημοσύνης που έχουμε αναπτύξει ποτέ».
Σε δήλωση που παραχώρησε στο Fortune μετά τη διαρροή, εκπρόσωπος της Anthropic περιέγραψε το Claude Mythos ως μια «ριζική αλλαγή» (step change) στην απόδοση της τεχνητής νοημοσύνης και δήλωσε ότι το μοντέλο είναι «το πιο ικανό που έχουμε κατασκευάσει μέχρι σήμερα». Η Anthropic αναφέρει ότι το Claude Mythos βρίσκεται επί του παρόντος σε στάδιο δοκιμών και είναι διαθέσιμο σε επιλεγμένους «πελάτες πρώιμης πρόσβασης».
Επιπλέον του νέου μοντέλου AI, η ανάρτηση που διέρρευσε αναφέρει επίσης ένα νέο, μη κυκλοφορημένο επίπεδο (tier) μοντέλου AI από την Anthropic που ονομάζεται Capybara.
Η Anthropic προσφέρει επί του παρόντος τρία διαφορετικά επίπεδα για κάθε μοντέλο AI της: Opus, Sonnet και Haiku. Το Opus είναι αυτή τη στιγμή το πιο ισχυρό και ακριβό επίπεδο, ενώ το Haiku είναι το μικρότερο και λιγότερο δαπανηρό. Το Capybara θα τοποθετείτο ακόμα πιο πάνω από το Opus ως το μεγαλύτερο και πιο έξυπνο επίπεδο μοντέλου AI της Anthropic.
Κίνδυνοι κυβερνοασφάλειας του Capybara
Η ανάρτηση που διέρρευσε περιγράφει επίσης τις ανησυχίες της Anthropic σχετικά με τους κινδύνους κυβερνοασφάλειας που φέρνει στο προσκήνιο το Claude Mythos. Φαίνεται ότι η Anthropic πιστεύει πως το Claude Mythos θα μπορούσε να χρησιμοποιηθεί από χάκερ για τη διεξαγωγή κυβερνοεπιθέσεων.
«Προετοιμαζόμενοι να κυκλοφορήσουμε το Claude Capybara, θέλουμε να ενεργήσουμε με ιδιαίτερη προσοχή και να κατανοήσουμε τους κινδύνους που ενέχει — πέρα ακόμη και από όσα μαθαίνουμε στις δικές μας δοκιμές», αναφέρει η ανάρτηση της Anthropic που διέρρευσε. «Συγκεκριμένα, θέλουμε να κατανοήσουμε τους πιθανούς βραχυπρόθεσμους κινδύνους του μοντέλου στον τομέα της κυβερνοασφάλειας — και να μοιραστούμε τα αποτελέσματα για να βοηθήσουμε τους αμυνόμενους στον κυβερνοχώρο να προετοιμαστούν».
Η Anthropic περιέγραψε το μη κυκλοφορημένο μοντέλο της ως «επί του παρόντος πολύ πιο μπροστά από οποιοδήποτε άλλο μοντέλο τεχνητής νοημοσύνης σε κυβερνο-ικανότητες» και ότι το μοντέλο «προαναγγέλλει ένα επερχόμενο κύμα μοντέλων που μπορούν να εκμεταλλευτούν τρωτά σημεία με τρόπους που ξεπερνούν κατά πολύ τις προσπάθειες των αμυνόμενων».
Η εταιρεία ανέφερε στο προσχέδιο του ιστολογίου που διέρρευσε ότι παρείχε πρώιμη πρόσβαση σε οργανισμούς για να τους δώσει «ένα προβάδισμα στη βελτίωση της στιβαρότητας των κωδικών τους έναντι του επικείμενου κύματος εκμεταλλεύσεων που καθοδηγούνται από την τεχνητή νοημοσύνη».



