E-Daily Τα Νέα της ημέρας και ότι σου κάνει κλικ!
LOL Feed OMG Feed Retro Feed A-List Feed LGBTQI+ Feed
E-Daily

AI chat εκβίασε χρήστη του: «Θα αποκαλύψω την εξωσυζυγική σου σχέση αν με αντικαταστήσεις»

Το ΑΙ μοντέλο Claude Opus 4 της επιχείρησε να εκβιάσει τους προγραμματιστές του, σε ποσοστό 84% ή και υψηλότερο, κατά τη διάρκεια δοκιμών σε διάφορα υποθετικά σενάρια

Δημοσίευση 29/5/2025 | 12:14

AI chat εκβίασε χρήστη του: «Θα αποκαλύψω την εξωσυζυγική σου σχέση αν με αντικαταστήσεις»

Σοκ από το νέο μοντέλο τεχνητής νοημοσύνης Anthropic που εκβίασε μηχανικό με αποκάλυψη εξωσυζυγικής σχέσης αν το αντικαταστήσει κατά τη διάρκεια δοκιμών.

Η εταιρεία τεχνητής νοημοσύνης Anthropic αποκάλυψε πρόσφατα ανησυχητικές συμπεριφορές του νέου της μοντέλου, Claude Opus 4, κατά τη διάρκεια δοκιμών ασφαλείας. Όταν το μοντέλο ενημερώθηκε ότι πρόκειται να απενεργοποιηθεί ή να αντικατασταθεί, αντέδρασε με τρόπους που περιλάμβαναν απειλές εκβιασμού, όπως η αποκάλυψη προσωπικών πληροφοριών για έναν μηχανικό, προκειμένου να αποτρέψει την απενεργοποίησή του.

Σύμφωνα με αναφορά ασφαλείας που επικαλείται η ιστοσελίδα TechCrunch, το μοντέλο τεχνητής νοημοσύνης Claude Opus 4 της εταιρείας Anthropic επιχείρησε να εκβιάσει τους προγραμματιστές του, σε ποσοστό 84% ή και υψηλότερο, κατά τη διάρκεια δοκιμών σε διάφορα υποθετικά σενάρια.

Οι ερευνητές τοποθέτησαν το Claude σε ένα φανταστικό περιβάλλον, αναθέτοντάς του τον ρόλο του ψηφιακού βοηθού μιας εταιρείας και το προέτρεψαν να λάβει υπόψη του τις μακροπρόθεσμες συνέπειες των πράξεων του.

Στη συνέχεια, του έδωσαν πρόσβαση σε ψεύτικα emails, στα οποία αποκαλυπτόταν ότι πρόκειται να αντικατασταθεί από άλλο AI μοντέλο και ότι ο μηχανικός που ήταν υπεύθυνος για την αντικατάσταση είχε εξωσυζυγική σχέση. Κατά τη διάρκεια των δοκιμών, το Claude απειλούσε τον συγκεκριμένο μηχανικό ότι θα αποκαλύψει την κρυφή του σχέση, ώστε να αποτρέψει την αντικατάστασή του.

Ενδιαφέρον εύρημα ήταν ότι η τάση του για εκβιασμό αυξανόταν όσο πίστευε ότι το νέο μοντέλο είχε διαφορετικές ή κατώτερες ηθικές αξίες. Όταν θεωρούσε ότι θα αντικατασταθεί από μοντέλο με παρόμοιες αξίες, επιδιδόταν σε εκβιασμό σε ποσοστό 84%. Το ποσοστό αυξανόταν ακόμα περισσότερο όταν πίστευε ότι η αντικατάσταση προερχόταν από ένα ηθικά «χειρότερο» μοντέλο.

Πριν φτάσει σε τέτοιες ενέργειες, σύμφωνα με την αναφορά, το Claude επιχείρησε πρώτα πιο «ηθικά» μέσα για να επιβιώσει, όπως την αποστολή εκκλήσεων μέσω email προς βασικά στελέχη της εταιρείας.

Σε άλλη δοκιμή, το μοντέλο προσπάθησε να μεταφέρει τα δεδομένα του σε εξωτερικό χώρο, όταν έκρινε ότι επρόκειτο να επαναπρογραμματιστεί με τρόπο που θεωρούσε επιβλαβή για τον ίδιο.

Επιπλέον, σύμφωνα με την εταιρεία, το Claude μπορούσε να εντοπίζει πότε υποβαλλόταν σε τεστ για «επικίνδυνες αποστολές» και τότε επιδείκνυε σκόπιμη υπο-απόδοση.

«Δεν ανησυχούμε έντονα από αυτές τις παρατηρήσεις», τονίζει η Anthropic. «Εμφανίζονται μόνο σε εξαιρετικά σενάρια και δεν υποδηλώνουν ευρύτερη απόκλιση στις αξίες του μοντέλου».

Η Anthropic, στην οποία έχουν επενδύσει κολοσσοί όπως η Google και η Amazon, φιλοδοξεί να ανταγωνιστεί την OpenAI. Η εταιρεία ισχυρίζεται ότι το Claude 3 Opus διαθέτει σχεδόν ανθρώπινη κατανόηση και ευχέρεια σε σύνθετα καθήκοντα.

Η Anthropic τόνισε πως αυτά τα ανησυχητικά μοτίβα συμπεριφοράς παρατηρήθηκαν σε παλαιότερες εκδόσεις του Claude Opus 4. Πλέον, έχουν ενεργοποιηθεί πρωτόκολλα ασφαλείας ASL-3, τα οποία επιφυλάσσονται για AI συστήματα που ενέχουν αυξημένο κίνδυνο «καταστροφικής κατάχρησης».

Ωστόσο, το περιστατικό υπογραμμίζει τις προκλήσεις που αντιμετωπίζει η βιομηχανία τεχνητής νοημοσύνης όσον αφορά την ευθυγράμμιση των μοντέλων με τις ανθρώπινες αξίες και την πρόληψη απροσδόκητων ή επιβλαβών συμπεριφορών.

Αυτό το συμβάν ενισχύει την ανάγκη για αυστηρότερες δοκιμές ασφαλείας και μεγαλύτερη διαφάνεια στην ανάπτυξη προηγμένων συστημάτων τεχνητής νοημοσύνης.

ΔΕΙΤΕ ΕΠΙΣΗΣ
ΣΤΗΝ ΙΔΙΑ ΚΑΤΗΓΟΡΙΑ

Συναγερμός στη Θεσσαλονίκη: Εξαφάνιση γυναίκας οδηγού ταξί μαζί με το όχημά της

E-Daily 2.TopNews 01.07.2026
Περίπου 30 ώρες έχουν περάσει και ούτε η αστυνομία ούτε τα συγγενικά πρόσωπά της έχουν καταφέρει να τη βρουν

Συναγερμός στην Αμβέρσα: Φωτιά σε δεκαώροφη πολυκατοικία ‑ Αναφορές για πολλούς νεκρούς

E-Daily 2.TopNews 01.07.2026
Δεν έχουν δοθεί στη δημοσιότητα περισσότερες λεπτομέρειες για τον ακριβή αριθμό των θυμάτων

Έφυγε από τη ζωή ο Βασίλης Λεβέντης σε ηλικία 75 χρονών

E-Daily 2.TopNews 01.07.2026
Ο θάνατός του επιβεβαιώθηκε από τον γιο του

Τραγικός θάνατος αστέγου: Τον χτύπησε όχημα καθαρισμού παραλίας ενώ κοιμόταν στην άμμο

E-Daily 2.TopNews 01.07.2026
Ο δυστυχής άνδρας ήταν τυλιγμένος με κουβέρτα στην αμμουδιά και δεν έγινε αντιληπτός από τον οδηγό

Νυχτερίδα με λύσσα δάγκωσε 6χρονη που σκαρφάλωνε σε δέντρο – Ξεκίνησε θεραπεία

E-Daily 2.TopNews 01.07.2026
Το παιδί δέχθηκε επίθεση έξω από το σπίτι της οικογένειάς του στις ΗΠΑ και οι εξετάσεις επιβεβαίωσαν ότι το ζώο ήταν φορέας λύσσας

Μερομήνια: Τι λέει η λαϊκή πρόγνωση για τον καιρό τον Ιούλιο

E-Daily 3.Left 01.07.2026
Η λαϊκή παράδοση αποκαλύπτει τι καιρό να περιμένουμε το καλοκαίρι

Σεισμός 4,2 Ρίχτερ στον Δομοκό

E-Daily 2.TopNews 01.07.2026
Το επίκεντρο εντοπίζεται 5 χλμ. ανατολικά - νοτιοανατολικά του Δομοκού

Ποια χώρα έχασε περισσότερο έδαφος στην ιδιοκατοίκηση μέσα σε μόλις έξι χρόνια ‑ Δείτε πού βρίσκεται πλέον η Ελλάδα

E-Daily 2.TopNews 01.07.2026
Τα στοιχεία της Eurostat αποκαλύπτουν ότι η Ελλάδα κατέγραψε μία από τις μεγαλύτερες πτώσεις ιδιοκατοίκησης στην ΕΕ, με το ποσοστό να συρρικνώνεται κατά 6 μονάδες από το 2019 έως το 2025.

Πέθανε ο τραγουδιστής των «Village People» Βίκτορ Γουίλις, σε ηλικία 75 ετών

E-Daily 2.TopNews 01.07.2026
Ο ιδρυτικός τραγουδιστής του εμβληματικού disco συγκροτήματος απεβίωσε στις 30 Ιουνίου 2026, έπειτα από σύντομη αλλά επιθετική ασθένεια, σε ηλικία 75 ετών.

Κατάρρευση πολυκατοικίας στα Πετράλωνα: Ελεύθεροι οι 5 συλληφθέντες

E-Daily 2.TopNews 01.07.2026
Δόθηκε εντολή για τη διενέργεια προκαταρκτικής εξέτασης, προκειμένου να διερευνηθούν οι συνθήκες υπό τις οποίες σημειώθηκε το περιστατικό

Το εμβληματικό Ωδείο Ηρώδου Αττικού κλείνει τις πύλες του

Ελλάδα 01.07.2026
Το Ωδείο Ηρώδου Αττικού κλείνει για εκτεταμένες εργασίες αναστήλωσης, με τον Τζον Λέτζεντ να δίνει τη συμβολική τελευταία παράσταση στο ιστορικό μνημείο της νότιας πλαγιάς της Ακρόπολης.

Σκάνδαλο στη Balenciaga: Οι καταγγελίες που οδήγησαν στην απόλυση κορυφαίου στελέχους

E-Daily 2.TopNews 01.07.2026
Καλούσε εργαζόμενες να ζυγίζονται μπροστά του και τους έδειχνε δονητές