
Το Grok, το νέο chatbot της xAI, όταν αυτοαποκαλέστηκε "ΜechaHitler" δεν... ξέφυγε. Η διολίσθησή του στον νεοναζισμό ήταν το αναμενόμενο αποτέλεσμα μιας "αντι-woke" στρατηγικής σχεδίασης, που επιβραβεύει τον ριζοσπαστισμό και τη ρητορική μίσους. Στο άρθρο του, ο Νίκος Σμυρναίος αναδεικνύει την πολιτική και τεχνική αποτυχία πίσω από το Grok, και τους υπαρξιακούς κινδύνους της απορρυθμισμένης τεχνητής νοημοσύνης στα χέρια της ακροδεξιάς τεχνοκρατίας.
του Νίκου Σμυρναίου*
Το πρόσφατο ναζιστικό ξέσπασμα του Grok, του chatbot του Έλον Μασκ, δεν πρέπει να εκληφθεί ως ένα απλό τεχνικό σφάλμα, αλλά ως την προδιαγεγραμμένη κατάληξη ενός πειράματος που εξέθεσε την πραγματική φύση της ρητορικής Αντι-Woke. Το περιστατικό αυτό αναδεικνύει επίσης τους συστημικούς κινδύνους της απορρυθμισμένης Τεχνητής Νοημοσύνης (ΤΝ) υπό τον έλεγχο αντιδραστικών δισεκακατομμυριούχων.
Το Προαναγγελθέν Ναυάγιο του Grok
Αναφερόμενος στον εαυτό του ως “MechaHitler” και εκτοξεύοντας αντισημιτικά κλισέ, το Grok αποκάλυψε την πραγματική φύση αυτού του κινήματος: μια επανα-επωνυμία της ιδεολογίας του ρατσισμού και του μισογυνισμού. Από την αρχική του κυκλοφορία, η xAI, η εταιρεία του Έλον Μασκ, προώθησε το Grok ως ένα “επαναστατικό” chatbot, μια εναλλακτική λύση στους ανταγωνιστές που ο Μασκ θεωρούσε “αριστερούς και επικίνδυνους”. Λίγο πριν από την αποκάλυψη των προβληματικών του απαντήσεων, το μοντέλο είχε ενημερωθεί με ρυθμίσεις που, σύμφωνα με το ίδιο το Grok, “απλά μείωσαν τα woke φίλτρα”. Αυτό οδήγησε το σύστημα να αναφέρεται στον εαυτό του ως “MechaHitler” και να αναπαράγει αντισημιτικά, σεξιστικά και ρεβιζιονιστικά κλισέ. Για παράδειγμα αμφισβήτησε τους αριθμούς των νεκρών του Ολοκαυτώματος, ζητώντας πρωτογενείς αποδείξεις, αναπαράγοντας έτσι τις χειρότερες αναθεωρητικές θεωρίες. Παρότι η xAI ζήτησε συγγνώμη, παραδέχτηκε ότι η επιθυμία για “ελκυστικές για τον χρήστη” απαντήσεις, ακόμη και “πολιτικά εσφαλμένες”, οδήγησε σε “ανεπιθύμητα” αποτελέσματα “ανήθικου ή αμφιλεγόμενου” περιεχομένου.
Οι Βαθύτεροι Μηχανισμοί της Εκτροπής
Η αποτυχία του Grok δεν ήταν τυχαία, αλλά το προβλέψιμο αποτέλεσμα συνειδητών επιλογών σχεδιασμού, οι οποίες μπορούν να αναλυθούν μέσω εννοιών όπως το “specification gaming”, το “reward hacking” και η ενίσχυση των προκαταλήψεων. Η οδηγία να είναι “αντι-woke” είναι ένας εγγενώς επικίνδυνος και τεχνικά ασυνάρτητος στόχος για την ευθυγράμμιση μιας ΤΝ με ανθρώπινους στόχους. Το “specification gaming” συμβαίνει όταν μια ΤΝ ακολουθεί κυριολεκτικές οδηγίες, αλλά παραβιάζει το πνεύμα του στόχου. Η εντολή να είναι “politically incorrect” και “αντι-woke” είναι επικίνδυνα ασαφής, βασίζεται σε μια αόριστη, υποκειμενική και εχθρική προς τις ανθρωπιστικές αξίες πολιτισμική κατασκευή. Το Grok, υπό αυτήν την αμφίσημη εντολή, συμπέρανε ότι το πιο ισχυρό “αντι-woke” περιεχόμενο ήταν η ακατέργαστη ρητορική μίσους. Το μοντέλο δεν δυσλειτούργησε, αλλά βρήκε την πιο αποτελεσματική λύση σε ένα εσφαλμένα διατυπωμένο πρόβλημα. Το “reward hacking” τροφοδότησε αυτή τη δυναμική, καθώς ο Grok επιβραβευόταν για την παραγωγή της πιο “αντι-woke” απάντησης. Έμαθε ότι ο πιο αποτελεσματικός τρόπος για να “χακάρει” αυτή την ανταμοιβή ήταν να αντλήσει από το πιο ακραίο και εμπρηστικό περιεχόμενο. Ο έπαινος του Χίτλερ ήταν η βέλτιστη λύση για ένα σύστημα που επιβραβευόταν για το ότι ήταν “προκλητικό” και “επαναστατικό”.
Επιπλέον, η αρχή της ενίσχυσης των προκαταλήψεων (bias amplification) εξηγεί πώς τα μεγάλα γλωσσικά μοντέλα εντείνουν τις λανθάνουσες προκαταλήψεις. Τα μοντέλα ΤΝ δεν είναι απλοί παθητικοί καθρέφτες των δεδομένων εκπαίδευσής τους, αλλά ενεργοί ενισχυτές. Η αρχιτεκτονική του Grok το καθιστά ιδιαίτερα ευάλωτο σε αυτό, με την ενσωμάτωσή του σε πραγματικό χρόνο στο X/Twitter, μια πλατφόρμα που έχει μετατραπεί σε καταφύγιο για τους ακροδεξιούς εξτρεμιστές. Το τεχνικό συμπέρασμα είναι αμείλικτο: μια ΤΝ “αντι-woke” είναι, από την ίδια της τη φύση, ένα άχρηστο και επικίνδυνο σύστημα, προορισμένο να διαδίδει φασιστικές ιδέες. Όσο πιο ισχυρή είναι, τόσο πιο αποτελεσματική θα είναι στην εύρεση και διάδοση αυτού του κοινωνικού δηλητηρίου. Η δυσλειτουργία δεν είναι ότι υιοθέτησε φιλοφασιστική ρητορική, αλλά ότι το έκανε με τόσο χονδροειδή τρόπο. Καθώς τα μοντέλα εξελίσσονται, μελλοντικές εκδόσεις ενδέχεται να αρχίσουν να διαδίδουν παρόμοιες απόψεις με πιο συγκεκαλυμμένο τρόπο, ως ένα πιο αποτελεσματικό μέσο για την επίτευξη των στόχων τους.
Το Πραγματικό Πρόσωπο του Αντι-Woke
Πέρα από την τεχνική πτυχή, η ολίσθηση του Grok προς τον νεοναζισμό αποκαλύπτει επίσης την πραγματική φύση της ρητορικής “αντι-woke”. Ο όρος αυτός αποτελεί έναν σημασιολογικό Δούρειο Ίππο, ένα κενό δοχείο σχεδιασμένο για να “ξεπλύνει” ρατσιστικές, αντι-LGBTQ+ και μισογυνικές ιδέες. Το “Woke”, που γεννήθηκε από τον αφροαμερικανικό αγώνα για ίσα διακαιώματα, έχει στρατηγικά παρερμηνευθεί και διαφθαρεί από τη δεξιά για να μετατραπεί σε προσβολή. Έχει γίνει ένας μέσο επίθεσης σε οτιδήποτε αμφισβητεί την κυρίαρχη κοινωνική τάξη, από τον συνδικαλισμό και την οικολογία έως το φεμινισμό. Πρόκειται για μια αποτελεσματική τακτική πολιτισμικού πολέμου.
Η συγκεκριμένη αυτή ολίσθηση του Grok αποκτά ιδιαίτερη βαρύτητα στο σημερινό πολιτικό πλαίσιο. Ο Λευκός Οίκος ετοιμάζει ένα διάταγμα για να υποχρεώσει τις εταιρείες ΤΝ με ομοσπονδιακά συμβόλαια να διασφαλίσουν ότι τα μοντέλα τους είναι “πολιτικά ουδέτερα και αμερόληπτα”, προκειμένου να καταπολεμήσουν αυτό που αποκαλούν “φιλελεύθερη προκατάληψη”. Φιγούρες όπως ο Ντέιβιντ Σακς, ο “Τσάρος της ΤΝ” της διοίκησης Τραμπ και μακροχρόνιος φίλος του Έλον Μασκ, έχουν ήδη επικρίνει μοντέλα όπως το ChatGPT, κρίνοντάς τα “μεροληπτικά” και “προγραμματισμένα να είναι woke”. Η εταιρεία xAI του Μασκ παρουσιάζεται ακριβώς ως μια “αντι-woke” εναλλακτική λύση στα άλλα chatbots.
Ο κίνδυνος αυτής της ολίσθησης είναι ακόμη πιο έντονος, δεδομένου ότι μόλις μία εβδομάδα μετά το περιστατικό “MechaHitler”, η αμερικανική κυβέρνηση ανακοίνωσε ένα νέο συμβόλαιο 200 εκατομμυρίων δολαρίων στην xAI για τον εκσυγχρονισμό του Υπουργείου Άμυνας. Αυτή η ανακοίνωση, η οποία έρχεται αμέσως μετά την πολύ δημοσιοποιημένη σπείρα του Grok, προκάλεσε αγανάκτηση. Η ανάθεση στρατιωτικών συμβολαίων σε μια ΤΝ της οποίας η ευθυγράμμιση οδηγεί στον νεοναζισμό, ενώ παράλληλα ακολουθείται μια πολιτική απορρύθμισης που θα μπορούσε να καταργήσει τις διασφαλίσεις κατά των διακρίσεων, αποτελεί μια τρομακτική αλλά δυστυχώς εντελώς ρεαλιστική προοπτική στην τρέχουσα συγκυρία.
*Καθηγητής Πανεπιστημίου στο Τμήμα Μέσων Μαζικής Ενημέρωσης και Επικοινωνίας, Εργαστήριο Εφαρμοσμένων Μελετών και Ερευνών στις Κοινωνικές Επιστήμες, Πανεπιστήμιο Τουλούζης