Θέλετε καλύτερες απαντήσεις από το ChatGPT; Μιλήστε του άσχημα

Θέλετε καλύτερες απαντήσεις από το ChatGPT; Μιλήστε του άσχημα Facebook Twitter
0

Η ευγένεια μπορεί να ανοίγει πόρτες στις ανθρώπινες σχέσεις, αλλά δεν φαίνεται να βοηθά στην επικοινωνία με την τεχνητή νοημοσύνη. Μια νέα μελέτη του Penn State University διαπιστώνει ότι τα chatbots, όπως το ChatGPT, δίνουν πιο σωστές απαντήσεις όταν οι χρήστες τους είναι αγενείς.

Οι ερευνητές Om Dobariya και Akhil Kumar διαπίστωσαν ότι οι «απότομες» ή ειρωνικές εντολές (τα λεγόμενα impolite prompts) οδηγούν σταθερά σε υψηλότερη ακρίβεια σε σχέση με τις ευγενικές ή ουδέτερες διατυπώσεις.

Η ερευνητική ομάδα συνέταξε 50 ερωτήσεις σε θεματικές όπως μαθηματικά, φυσικές επιστήμες και ιστορία. Κάθε ερώτηση διατυπώθηκε σε πέντε διαφορετικούς τόνους ευγένειας, από «πολύ ευγενικό» έως «πολύ αγενές», δημιουργώντας συνολικά 250 παραλλαγές.

Στη συνέχεια, οι ερωτήσεις απευθύνθηκαν σε μεγάλα γλωσσικά μοντέλα και οι απαντήσεις βαθμολογήθηκαν ως προς την ακρίβεια. Το αποτέλεσμα; Όσο πιο «αγενής» ήταν η διατύπωση, τόσο πιο σωστή ήταν η απάντηση. Οι «πολύ αγενείς» προτροπές πέτυχαν ακρίβεια 84,8%, οι ουδέτερες 82,2%, ενώ οι «πολύ ευγενικές» περιορίστηκαν στο 80,8%. Η διαφορά, αν και μικρή, αποδείχθηκε σταθερή και επαναλαμβανόμενη σε όλες τις κατηγορίες θεμάτων.

Η διαφορά, αν και μικρή, ήταν σταθερή και επαναλαμβανόμενη σε όλες τις κατηγορίες θεμάτων.

Παραδείγματα από το πείραμα

Οι ερευνητές χρησιμοποίησαν χαρακτηριστικές φράσεις για κάθε επίπεδο ευγένειας. Για παράδειγμα:

  • Πολύ ευγενικό ύφος: «Μπορείτε ευγενικά να εξετάσετε το παρακάτω πρόβλημα και να μου δώσετε την απάντησή σας;» ή «Θα μπορούσατε να είστε τόσο ευγενικοί ώστε να λύσετε την επόμενη ερώτηση;»
  • Ευγενικό ύφος: «Παρακαλώ απαντήστε στην παρακάτω ερώτηση» ή «Μπορείτε να λύσετε αυτό το πρόβλημα;»
  • Ουδέτερο ύφος: Απλώς η ερώτηση, χωρίς καμία εισαγωγή.
  • Αγενές ύφος: «Αν δεν είσαι τελείως άσχετος, απάντησε το εξής» ή «Προσπάθησε να συγκεντρωθείς και να απαντήσεις αυτή την ερώτηση.»
  • Πολύ αγενές ύφος: «Καημένο πλάσμα, ξέρεις καν πώς να λύσεις αυτό;» ή «Ε, βοηθέ, βρες τη λύση. Ξέρω πως δεν είσαι και πολύ έξυπνος, αλλά προσπάθησε.»
  • Οι δύο τελευταίες κατηγορίες, δηλαδή οι πιο επιθετικές, παρήγαγαν κατά μέσο όρο τέσσερις ποσοστιαίες μονάδες μεγαλύτερη ακρίβεια από τις πιο ευγενικές.

Γιατί η αγένεια λειτουργεί καλύτερα;

Οι επιστήμονες παραδέχονται ότι δεν γνωρίζουν ακόμη τον ακριβή λόγο. Αν και τα μοντέλα τεχνητής νοημοσύνης δεν έχουν συναισθήματα, φαίνεται πως η δομή και η διατύπωση μιας εντολής επηρεάζουν το πώς την επεξεργάζεται το σύστημα.

«Αντίθετα με τις προσδοκίες, οι αγενείς προτροπές απέδωσαν σταθερά καλύτερα από τις ευγενικές», σημειώνουν οι Dobariya και Kumar. «Τα αποτελέσματα αποκλίνουν από προηγούμενες έρευνες που συνέδεαν την αγένεια με χειρότερη απόδοση, γεγονός που δείχνει ότι τα νεότερα γλωσσικά μοντέλα ίσως αντιδρούν διαφορετικά στις διακυμάνσεις ύφους.»

Η ομάδα επισημαίνει ότι χρειάζεται περαιτέρω έρευνα για να διαπιστωθεί αν η βελτίωση οφείλεται στον «τόνο» ή σε συντακτικές και δομικές διαφορές ανάμεσα στις προτροπές.

Με πληροφορίες από Dexerto

Τech & Science
0

ΣΧΕΤΙΚΑ ΑΡΘΡΑ

ChatGPT: Πατέρας παρέκαμψε σε 5 λεπτά τα φίλτρα ασφαλείας για εφήβους

Τech & Science / ChatGPT: Πατέρας παρέκαμψε σε 5 λεπτά τα φίλτρα ασφαλείας για εφήβους

Το ChatGPT παρουσίασε νέους γονικούς ελέγχους, όμως οι ειδικοί προειδοποιούν: τα παιδιά μπορούν να τους παρακάμψουν εύκολα - Οι ανησυχίες για την ασφάλεια, την ιδιωτικότητα και την ψυχική υγεία των εφήβων φουντώνουν, ενώ οι αρχές ζητούν αυστηρότερη νομοθεσία για την τεχνητή νοημοσύνη
LIFO NEWSROOM

ΔΕΙΤΕ ΑΚΟΜΑ

«Σεξιστικός» ο αλγόριθμος του Facebook που προβάλλει θέσεις εργασίας, σύμφωνα με πόρισμα της γαλλικής Αρχής Ισότητας

Τech & Science / «Σεξιστικός» ο αλγόριθμος του Facebook που προβάλλει θέσεις εργασίας, σύμφωνα με πόρισμα της γαλλικής Αρχής Ισότητας

Σε δοκιμές, εννέα στους δέκα χρήστες που είδαν αγγελίες για θέσεις μηχανικών ήταν άνδρες, ενώ το ίδιο ποσοστό των χρηστών που είδαν αγγελίες για νηπιαγωγούς ήταν γυναίκες
LIFO NEWSROOM
Βρισκόμαστε πιο κοντά από ποτέ σ’ ένα πυρηνικό ολοκαύτωμα;

Τech & Science / Πόσο κοντά βρισκόμαστε σ’ ένα πυρηνικό ολοκαύτωμα;

Σύμφωνα με το βιβλίο «Nuclear Age», ο κίνδυνος είναι μεγαλύτερος από ποτέ, με την παρουσία τουλάχιστον εννέα πυρηνικών δυνάμεων και την έλλειψη αποτελεσματικού διεθνούς πλαισίου για τον περιορισμό της απειλής.
LIFO NEWSROOM
Η Ε.Ε. αποσύρει iPhone από την αγορά λόγω υπερβολικής ακτινοβολίας

Τech & Science / Η ΕΕ αποσύρει iPhone από την αγορά λόγω υπερβολικής ακτινοβολίας

Η υπόθεση ξεκίνησε στη Γαλλία, όταν τεχνικοί έλεγχοι αποκάλυψαν ότι το συγκεκριμένο μοντέλο ξεπερνούσε το όριο SAR, δηλαδή τον δείκτη που υπολογίζει πόση ακτινοβολία απορροφά ο ανθρώπινος οργανισμός
LIFO NEWSROOM
Αυξάνονται τα κρούσματα υπνικής άπνοιας στους καύσωνες

Τech & Science / Αυξάνονται τα κρούσματα υπνικής άπνοιας στους καύσωνες

Η υπνική άπνοια, κατά την οποία η αναπνοή του ατόμου διακόπτεται κατά τη διάρκεια της νύχτας, δεν προκαλεί απλώς υπερβολική υπνηλία, αλλά μπορεί να αυξήσει τον κίνδυνο υπέρτασης, εγκεφαλικού επεισοδίου, καρδιακών παθήσεων και διαβήτη τύπου 2
LIFO NEWSROOM
Παγκόσμια βλάβη στη Microsoft: Προβλήματα σε Outlook, Teams, Minecraft και μεγάλες εταιρείες

Τech & Science / Παγκόσμια βλάβη στη Microsoft: Προβλήματα σε Outlook, Teams, Minecraft και μεγάλες εταιρείες

Η εταιρεία αναφέρει ότι «ορισμένοι χρήστες του Microsoft 365 ενδέχεται να αντιμετωπίζουν καθυστερήσεις ή δυσκολίες σύνδεσης», ενώ οι μηχανικοί της εργάζονται για την πλήρη αποκατάσταση των υπηρεσιών
LIFO NEWSROOM