Θέλετε καλύτερες απαντήσεις από το ChatGPT; Μιλήστε του άσχημα

Θέλετε καλύτερες απαντήσεις από το ChatGPT; Μιλήστε του άσχημα Facebook Twitter
0

Η ευγένεια μπορεί να ανοίγει πόρτες στις ανθρώπινες σχέσεις, αλλά δεν φαίνεται να βοηθά στην επικοινωνία με την τεχνητή νοημοσύνη. Μια νέα μελέτη του Penn State University διαπιστώνει ότι τα chatbots, όπως το ChatGPT, δίνουν πιο σωστές απαντήσεις όταν οι χρήστες τους είναι αγενείς.

Οι ερευνητές Om Dobariya και Akhil Kumar διαπίστωσαν ότι οι «απότομες» ή ειρωνικές εντολές (τα λεγόμενα impolite prompts) οδηγούν σταθερά σε υψηλότερη ακρίβεια σε σχέση με τις ευγενικές ή ουδέτερες διατυπώσεις.

Η ερευνητική ομάδα συνέταξε 50 ερωτήσεις σε θεματικές όπως μαθηματικά, φυσικές επιστήμες και ιστορία. Κάθε ερώτηση διατυπώθηκε σε πέντε διαφορετικούς τόνους ευγένειας, από «πολύ ευγενικό» έως «πολύ αγενές», δημιουργώντας συνολικά 250 παραλλαγές.

Στη συνέχεια, οι ερωτήσεις απευθύνθηκαν σε μεγάλα γλωσσικά μοντέλα και οι απαντήσεις βαθμολογήθηκαν ως προς την ακρίβεια. Το αποτέλεσμα; Όσο πιο «αγενής» ήταν η διατύπωση, τόσο πιο σωστή ήταν η απάντηση. Οι «πολύ αγενείς» προτροπές πέτυχαν ακρίβεια 84,8%, οι ουδέτερες 82,2%, ενώ οι «πολύ ευγενικές» περιορίστηκαν στο 80,8%. Η διαφορά, αν και μικρή, αποδείχθηκε σταθερή και επαναλαμβανόμενη σε όλες τις κατηγορίες θεμάτων.

Η διαφορά, αν και μικρή, ήταν σταθερή και επαναλαμβανόμενη σε όλες τις κατηγορίες θεμάτων.

Παραδείγματα από το πείραμα

Οι ερευνητές χρησιμοποίησαν χαρακτηριστικές φράσεις για κάθε επίπεδο ευγένειας. Για παράδειγμα:

  • Πολύ ευγενικό ύφος: «Μπορείτε ευγενικά να εξετάσετε το παρακάτω πρόβλημα και να μου δώσετε την απάντησή σας;» ή «Θα μπορούσατε να είστε τόσο ευγενικοί ώστε να λύσετε την επόμενη ερώτηση;»
  • Ευγενικό ύφος: «Παρακαλώ απαντήστε στην παρακάτω ερώτηση» ή «Μπορείτε να λύσετε αυτό το πρόβλημα;»
  • Ουδέτερο ύφος: Απλώς η ερώτηση, χωρίς καμία εισαγωγή.
  • Αγενές ύφος: «Αν δεν είσαι τελείως άσχετος, απάντησε το εξής» ή «Προσπάθησε να συγκεντρωθείς και να απαντήσεις αυτή την ερώτηση.»
  • Πολύ αγενές ύφος: «Καημένο πλάσμα, ξέρεις καν πώς να λύσεις αυτό;» ή «Ε, βοηθέ, βρες τη λύση. Ξέρω πως δεν είσαι και πολύ έξυπνος, αλλά προσπάθησε.»
  • Οι δύο τελευταίες κατηγορίες, δηλαδή οι πιο επιθετικές, παρήγαγαν κατά μέσο όρο τέσσερις ποσοστιαίες μονάδες μεγαλύτερη ακρίβεια από τις πιο ευγενικές.

Γιατί η αγένεια λειτουργεί καλύτερα;

Οι επιστήμονες παραδέχονται ότι δεν γνωρίζουν ακόμη τον ακριβή λόγο. Αν και τα μοντέλα τεχνητής νοημοσύνης δεν έχουν συναισθήματα, φαίνεται πως η δομή και η διατύπωση μιας εντολής επηρεάζουν το πώς την επεξεργάζεται το σύστημα.

«Αντίθετα με τις προσδοκίες, οι αγενείς προτροπές απέδωσαν σταθερά καλύτερα από τις ευγενικές», σημειώνουν οι Dobariya και Kumar. «Τα αποτελέσματα αποκλίνουν από προηγούμενες έρευνες που συνέδεαν την αγένεια με χειρότερη απόδοση, γεγονός που δείχνει ότι τα νεότερα γλωσσικά μοντέλα ίσως αντιδρούν διαφορετικά στις διακυμάνσεις ύφους.»

Η ομάδα επισημαίνει ότι χρειάζεται περαιτέρω έρευνα για να διαπιστωθεί αν η βελτίωση οφείλεται στον «τόνο» ή σε συντακτικές και δομικές διαφορές ανάμεσα στις προτροπές.

Με πληροφορίες από Dexerto

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ChatGPT: Πατέρας παρέκαμψε σε 5 λεπτά τα φίλτρα ασφαλείας για εφήβους

Τech & Science / ChatGPT: Πατέρας παρέκαμψε σε 5 λεπτά τα φίλτρα ασφαλείας για εφήβους

Το ChatGPT παρουσίασε νέους γονικούς ελέγχους, όμως οι ειδικοί προειδοποιούν: τα παιδιά μπορούν να τους παρακάμψουν εύκολα - Οι ανησυχίες για την ασφάλεια, την ιδιωτικότητα και την ψυχική υγεία των εφήβων φουντώνουν, ενώ οι αρχές ζητούν αυστηρότερη νομοθεσία για την τεχνητή νοημοσύνη
LIFO NEWSROOM

ΔΕΙΤΕ ΑΚΟΜΑ

Σάλος με το Grok: Κατηγορείται για ακατάλληλες ΑΙ εικόνες διασημοτήτων μεταξύ των οποίων η Κέιτ Μίντλετον

Τech & Science / Σάλος με το Grok: Κατηγορείται για ακατάλληλες ΑΙ εικόνες διασημοτήτων μεταξύ των οποίων η Κέιτ Μίντλετον

Η πριγκίπισσα της Ουαλίας, μία ηθοποιός από το «Stranger Things» και μία δημοσιογράφος του BBC είναι μόνο μερικά από τα θύματα δημιουργίας ψεύτικων ακατάλληλων φωτογραφιών
THE LIFO TEAM
Grok: Συνεχίζεται η δημοσίευση εικόνων γυναικών και παιδιών με «ελάχιστο ρουχισμό» παρά τη δέσμευση για αναστολή λογαριασμών

Τech & Science / Grok: Συνεχίζεται η δημοσίευση εικόνων γυναικών και παιδιών με «ελάχιστο ρουχισμό» παρά τη δέσμευση για αναστολή λογαριασμών

Μετά την παγκόσμια κατακραυγή, ο Μασκ έγραψε σε ανάρτησή του πως «όποιος χρησιμοποιεί το Grok για να δημιουργεί παράνομο περιεχόμενο θα υποστεί τις ίδιες συνέπειες σαν να ανεβάζει παράνομο περιεχόμενο»
THE LIFO TEAM
ΤΕΧΝΗΤΗ ΝΟΗΜΟΣΥΝΗ ΚΙΝΔΥΝΟΙ

Τech & Science / Ερευνητής προειδοποιεί ότι ο κόσμος ίσως να μην προλάβει να προετοιμαστεί για τους κινδύνους της Τεχνητής Νοημοσύνης

Ο ερευνητής ανέφερε πως οι κυβερνήσεις δεν θα πρέπει να θεωρούν δεδομένη την αξιοπιστία των προηγμένων συστημάτων Τεχνητής Νοημοσύνης
THE LIFO TEAM
ΔΙΑΤΡΟΦΗ ΚΑΛΥΤΕΡΟΣ ΥΠΝΟΣ ΜΑΚΡΟΖΩΙΑ

Τech & Science / Αυτή η διατροφή μπορεί να βοηθήσει να κοιμάστε καλύτερα και να ζήσετε περισσότερο

Πρόκειται για την «ξαδέλφη» της μεσογειακής διατροφής, όπως γράφει το Νational Geographic, προσφέροντας τα ίδια οφέλη για την υγεία χάρη στον συνδυασμό τροφών πλούσιων σε αντιφλεγμονώδη και αντιοξειδωτικά
THE LIFO TEAM
Μελέτη αποκαλύπτει πώς η τεχνητή νοημοσύνη επηρεάζει τη θεραπεία των καρδιακών παθήσεων

Τech & Science / Μελέτη αποκαλύπτει πώς η τεχνητή νοημοσύνη επηρεάζει τη θεραπεία των καρδιακών παθήσεων

Ερευνητές αναφέρουν ότι η προηγμένη τεχνολογία θα μπορούσε να υποστηρίξει πιο εξατομικευμένη φροντίδα, επιτρέποντας οι θεραπείες να προσαρμόζονται καλύτερα στον τρόπο με τον οποίο λειτουργεί η καρδιά κάθε ατόμου
THE LIFO TEAM