Η Google DeepMind ανακοίνωσε ότι πέτυχε μια «ιστορική» πρόοδο στην τεχνητή νοημοσύνη, συγκρίσιμη με τη νίκη του υπερυπολογιστή Deep Blue απέναντι στον Garry Kasparov στο σκάκι το 1997 και την κατάκτηση του παιχνιδιού Go από το AlphaGo το 2016.
Μια παραλλαγή του μοντέλου Gemini 2.5 κατάφερε να επιλύσει ένα εξαιρετικά σύνθετο, ρεαλιστικό πρόβλημα που απέτυχαν να λύσουν όλοι οι ανθρώπινοι διαγωνιζόμενοι, κατακτώντας το πρώτο χρυσό μετάλλιο που απονέμεται ποτέ σε μοντέλο AI σε διεθνή διαγωνισμό προγραμματισμού. Ο διαγωνισμός πραγματοποιήθηκε νωρίτερα αυτόν τον μήνα στο Αζερμπαϊτζάν.
Λύση σε πρόβλημα «άπειρων πιθανοτήτων» σε λιγότερο από 30 λεπτά
Σε μια επίδοση που η DeepMind χαρακτήρισε ως «βαθύ άλμα στην αφηρημένη επίλυση προβλημάτων», το μοντέλο χρειάστηκε λιγότερο από μισή ώρα για να επιλύσει ένα πρόβλημα που απαιτούσε τον υπολογισμό άπειρων πιθανοτήτων: πώς να διοχετεύσει υγρό μέσα από ένα δίκτυο σωληνώσεων προς συνδεδεμένες δεξαμενές με τον ταχύτερο δυνατό τρόπο.
Καμία από τις ανθρώπινες ομάδες – περιλαμβανομένων των κορυφαίων πανεπιστημιακών από τη Ρωσία, την Κίνα και την Ιαπωνία – δεν κατάφερε να βρει τη σωστή λύση.
Αν και το AI απέτυχε σε 2 από τα 12 συνολικά προβλήματα που του τέθηκαν, η συνολική του απόδοση το κατέταξε στη 2η θέση ανάμεσα σε 139 από τους καλύτερους φοιτητικούς προγραμματιστές παγκοσμίως.
Η Google χαρακτήρισε την επίδοση ως «ιστορική στιγμή προς την Τεχνητή Γενική Νοημοσύνη (AGI)», δηλαδή ένα σύστημα με ανθρώπινης κλίμακας νοημοσύνη που μπορεί να ανταποκριθεί σε ευρύ φάσμα εργασιών.
«Ό,τι ήταν το Deep Blue για το σκάκι, είναι το Gemini για τον πραγματικό κόσμο»
«Για μένα, είναι μια στιγμή ισοδύναμη με το Deep Blue για το σκάκι και το AlphaGo για το Go», δήλωσε ο Quoc Le, αντιπρόεδρος της Google DeepMind.
«Ίσως ακόμη μεγαλύτερη, επειδή το μοντέλο κάνει λογικούς συλλογισμούς σε πραγματικές συνθήκες, όχι σε περιορισμένα περιβάλλοντα όπως το σκάκι ή το Go… Γι’ αυτό και θεωρώ ότι αυτή η πρόοδος έχει τη δυνατότητα να μεταμορφώσει επιστημονικά και μηχανικά πεδία», είπε, αναφερόμενος μεταξύ άλλων στον σχεδιασμό φαρμάκων και μικροτσίπ.
Το μοντέλο Gemini 2.5 είναι γενικής χρήσης, αλλά εκπαιδεύτηκε ειδικά για την επίλυση πολύπλοκων προβλημάτων κώδικα, μαθηματικών και λογικής. Σύμφωνα με τη Google, απέδωσε όπως ένας από τους 20 κορυφαίους προγραμματιστές στον κόσμο.
«Δημιουργικότητα, αφηρημένη σκέψη και σπινθήρας ευφυΐας»
Η Google τόνισε ότι η επίλυση τέτοιων προβλημάτων απαιτεί:
-
Βαθιά αφηρημένη σκέψη
-
Δημιουργικότητα
-
Ικανότητα σύνθεσης λύσεων για προβλήματα που δεν έχουν ξαναπαρουσιαστεί
-
Και έναν πραγματικό σπινθήρα ευφυΐας
Ωστόσο, δεν συμμερίζονται όλοι την ίδια ενθουσιώδη εκτίμηση.
Ενστάσεις: «Ίσως υπερβολική η δραματοποίηση»
Ο Stuart Russell, καθηγητής επιστήμης υπολογιστών στο Πανεπιστήμιο της Καλιφόρνια στο Μπέρκλεϊ, πριν δημοσιοποιηθούν οι λεπτομέρειες, σχολίασε ότι «οι ισχυρισμοί περί ορόσημου παγκόσμιας σημασίας φαίνονται υπερβολικοί».
Όπως ανέφερε, τα συστήματα τεχνητής νοημοσύνης επιδεικνύουν καλή απόδοση σε εργασίες προγραμματισμού εδώ και καιρό, και η νίκη του Deep Blue στο σκάκι δεν είχε καμία ουσιαστική επίδραση στον πραγματικό κόσμο της εφαρμοσμένης τεχνητής νοημοσύνης.
Παρ’ όλα αυτά, παραδέχτηκε: «Για να απαντήσει κανείς σωστά σε μια ερώτηση ICPC (Διεθνής Φοιτητικός Διαγωνισμός Προγραμματισμού), ο κώδικας πρέπει να λειτουργεί σωστά — τουλάχιστον σε έναν πεπερασμένο αριθμό περιπτώσεων δοκιμής. Οπότε αυτή η επίδοση ίσως δείχνει πρόοδο προς τη δημιουργία AI συστημάτων που παράγουν πραγματικά ποιοτικό και λειτουργικό κώδικα».
Και πρόσθεσε: «Η πίεση στις εταιρείες AI να ανακοινώνουν συνεχώς “επαναστάσεις” είναι τεράστια».
Ερωτήματα για τη χρήση υπολογιστικής ισχύος
Ο Michael Wooldridge, καθηγητής τεχνητής νοημοσύνης στο Πανεπιστήμιο της Οξφόρδης, χαρακτήρισε το επίτευγμα εντυπωσιακό, προσθέτοντας: «Η ικανότητα επίλυσης προβλημάτων σε αυτό το επίπεδο είναι πράγματι συναρπαστική».
Ωστόσο, εξέφρασε επιφυλάξεις για το πόση υπολογιστική ισχύ απαιτήθηκε για να επιτευχθεί το αποτέλεσμα. Η Google δεν έδωσε σαφή απάντηση, παρά μόνο ότι το μοντέλο χρησιμοποιεί περισσότερη ισχύ από εκείνη που προσφέρεται στη μηνιαία συνδρομή των 250 δολαρίων του Google AI Ultra, μέσω της ελαφριάς έκδοσης του Gemini 2.5 Deep Think στην εφαρμογή Gemini.
Το σχόλιο του Διευθυντή του ICPC: Σημαντική καμπή
Ο Dr Bill Poucher, εκτελεστικός διευθυντής του ICPC, δήλωσε:
«Η επιτυχία του Gemini να ενταχθεί στον διαγωνισμό και να πετύχει αποτελέσματα χρυσού επιπέδου αποτελεί καθοριστική στιγμή για τον καθορισμό των εργαλείων AI και των ακαδημαϊκών προτύπων που θα χρειαστεί η επόμενη γενιά».



