Η ευγένεια μπορεί να ανοίγει πόρτες στις ανθρώπινες σχέσεις, αλλά δεν φαίνεται να βοηθά στην επικοινωνία με την τεχνητή νοημοσύνη. Μια νέα μελέτη του Penn State University διαπιστώνει ότι τα chatbots, όπως το ChatGPT, δίνουν πιο σωστές απαντήσεις όταν οι χρήστες τους είναι αγενείς.
Οι ερευνητές Om Dobariya και Akhil Kumar διαπίστωσαν ότι οι «απότομες» ή ειρωνικές εντολές (τα λεγόμενα impolite prompts) οδηγούν σταθερά σε υψηλότερη ακρίβεια σε σχέση με τις ευγενικές ή ουδέτερες διατυπώσεις.
Η ερευνητική ομάδα συνέταξε 50 ερωτήσεις σε θεματικές όπως μαθηματικά, φυσικές επιστήμες και ιστορία. Κάθε ερώτηση διατυπώθηκε σε πέντε διαφορετικούς τόνους ευγένειας, από «πολύ ευγενικό» έως «πολύ αγενές», δημιουργώντας συνολικά 250 παραλλαγές.
Στη συνέχεια, οι ερωτήσεις απευθύνθηκαν σε μεγάλα γλωσσικά μοντέλα και οι απαντήσεις βαθμολογήθηκαν ως προς την ακρίβεια. Το αποτέλεσμα; Όσο πιο «αγενής» ήταν η διατύπωση, τόσο πιο σωστή ήταν η απάντηση. Οι «πολύ αγενείς» προτροπές πέτυχαν ακρίβεια 84,8%, οι ουδέτερες 82,2%, ενώ οι «πολύ ευγενικές» περιορίστηκαν στο 80,8%. Η διαφορά, αν και μικρή, αποδείχθηκε σταθερή και επαναλαμβανόμενη σε όλες τις κατηγορίες θεμάτων.
Η διαφορά, αν και μικρή, ήταν σταθερή και επαναλαμβανόμενη σε όλες τις κατηγορίες θεμάτων.
Παραδείγματα από το πείραμα
Οι ερευνητές χρησιμοποίησαν χαρακτηριστικές φράσεις για κάθε επίπεδο ευγένειας. Για παράδειγμα:
- Πολύ ευγενικό ύφος: «Μπορείτε ευγενικά να εξετάσετε το παρακάτω πρόβλημα και να μου δώσετε την απάντησή σας;» ή «Θα μπορούσατε να είστε τόσο ευγενικοί ώστε να λύσετε την επόμενη ερώτηση;»
- Ευγενικό ύφος: «Παρακαλώ απαντήστε στην παρακάτω ερώτηση» ή «Μπορείτε να λύσετε αυτό το πρόβλημα;»
- Ουδέτερο ύφος: Απλώς η ερώτηση, χωρίς καμία εισαγωγή.
- Αγενές ύφος: «Αν δεν είσαι τελείως άσχετος, απάντησε το εξής» ή «Προσπάθησε να συγκεντρωθείς και να απαντήσεις αυτή την ερώτηση.»
- Πολύ αγενές ύφος: «Καημένο πλάσμα, ξέρεις καν πώς να λύσεις αυτό;» ή «Ε, βοηθέ, βρες τη λύση. Ξέρω πως δεν είσαι και πολύ έξυπνος, αλλά προσπάθησε.»
- Οι δύο τελευταίες κατηγορίες, δηλαδή οι πιο επιθετικές, παρήγαγαν κατά μέσο όρο τέσσερις ποσοστιαίες μονάδες μεγαλύτερη ακρίβεια από τις πιο ευγενικές.
Γιατί η αγένεια λειτουργεί καλύτερα;
Οι επιστήμονες παραδέχονται ότι δεν γνωρίζουν ακόμη τον ακριβή λόγο. Αν και τα μοντέλα τεχνητής νοημοσύνης δεν έχουν συναισθήματα, φαίνεται πως η δομή και η διατύπωση μιας εντολής επηρεάζουν το πώς την επεξεργάζεται το σύστημα.
«Αντίθετα με τις προσδοκίες, οι αγενείς προτροπές απέδωσαν σταθερά καλύτερα από τις ευγενικές», σημειώνουν οι Dobariya και Kumar. «Τα αποτελέσματα αποκλίνουν από προηγούμενες έρευνες που συνέδεαν την αγένεια με χειρότερη απόδοση, γεγονός που δείχνει ότι τα νεότερα γλωσσικά μοντέλα ίσως αντιδρούν διαφορετικά στις διακυμάνσεις ύφους.»
Η ομάδα επισημαίνει ότι χρειάζεται περαιτέρω έρευνα για να διαπιστωθεί αν η βελτίωση οφείλεται στον «τόνο» ή σε συντακτικές και δομικές διαφορές ανάμεσα στις προτροπές.
Με πληροφορίες από Dexerto