Η Microsoft παρουσίασε ένα νέο εργαλείο τεχνητής νοημοσύνης που, σε δοκιμαστικά σενάρια, ξεπέρασε κατά πολύ την απόδοση ανθρώπινων γιατρών στη διάγνωση σύνθετων ασθενειών.

Σύμφωνα με την εταιρεία, η τεχνολογία αυτή μπορεί να επιταχύνει τη διάγνωση και να μειώσει το κόστος περίθαλψης, ανακουβίζοντας έτσι τα, σε πολλές χώρες ήδη επιβαρυμένα, συστήματα υγείας.

Το εργαλείο ονομάζεται Microsoft AI Diagnostic Orchestrator (ή MAI-DxO) και είναι η πρώτη εφαρμογή που προκύπτει από τη νέα ερευνητική μονάδα της Microsoft στον τομέα της υγείας. Επικεφαλής της είναι ο Μουσταφά Σουλεϊμάν, συνιδρυτής της DeepMind, του ερευνητικού εργαστηρίου τεχνητής νοημοσύνης που σήμερα ανήκει στην Google. Στη νέα ομάδα συμμετέχουν αρκετοί πρώην συνεργάτες του από την DeepMind, τους οποίους έφερε μαζί του στη Microsoft.

Πώς δουλεύει το νέο AI εργαλείο της Microsoft

Όπως δήλωσε ο ίδιος στους Financial Times, πρόκειται για ένα ακόμη βήμα προς αυτό που αποκαλεί «ιατρική υπερνοημοσύνη»: ένα σύστημα ικανό να βοηθήσει όχι μόνο στη διάγνωση, αλλά και στην κάλυψη των τεράστιων ελλείψεων προσωπικού που αντιμετωπίζουν τα δημόσια συστήματα υγείας.

We're taking a big step towards medical superintelligence. AI models have aced multiple choice medical exams – but real patients don’t come with ABC answer options. Now MAI-DxO can solve some of the world’s toughest open-ended cases with higher accuracy and lower costs. pic.twitter.com/PVMdxIwhhx — Mustafa Suleyman (@mustafasuleyman) June 30, 2025

Το σύστημα συγκροτεί μια ψηφιακή «ομάδα γιατρών», αποτελούμενη από πέντε διαφορετικούς AI πράκτορες, με τον καθένα να έχει έναν εξειδικευμένο ρόλο. Ο ένας διατυπώνει υποθέσεις, άλλος επιλέγει διαγνωστικές εξετάσεις, ένας τρίτος εκτιμά πιθανότητες κ.ο.κ. Οι μονάδες αυτές αλληλεπιδρούν μεταξύ τους, συζητούν, διαφωνούν και καταλήγουν συλλογικά στη διάγνωση, μιμούμενες μια πραγματική ιατρική ομάδα.

Για να δοκιμαστεί η αποτελεσματικότητα του συστήματος, η Microsoft του παρείχε 304 πολύπλοκες κλινικές περιπτώσεις από το New England Journal of Medicine, οι οποίες περιέγραφαν πώς γιατροί χειρίστηκαν ασθενείς με εξαιρετικά δύσκολες διαγνώσεις.

Στόχος δεν ήταν απλώς η σωστή απάντηση, αλλά και η τεκμηρίωση της διαδικασίας. Το MAI-DxO χρησιμοποιεί μια μέθοδο που ονομάζεται αλυσίδα αντιλογίας (chain of debate), όπου το σύστημα καταγράφει βήμα προς βήμα τη συλλογιστική του, από το πώς ερμηνεύει τα δεδομένα, μέχρι το πώς απορρίπτει λάθος σενάρια και καταλήγει στη σωστή διάγνωση.

«Τέσσερις φορές πιο ακριβής από πραγματικούς γιατρούς»

Η Microsoft χρησιμοποίησε τα κορυφαία γλωσσικά μοντέλα τεχνητής νοημοσύνης της αγοράς, από εταιρείες όπως η OpenAI, η Meta, η Anthropic, η Google, η xAI και η DeepSeek. Ο «συντονιστής» (orchestrator) αύξησε την απόδοση όλων, όμως οι καλύτερες επιδόσεις καταγράφηκαν όταν το σύστημα συνεργάστηκε με το νέο μοντέλο «o3» της OpenAI, με την ακρίβεια φτάνει το 85,5%.

What they found:

- MAI-DxO boosted performance of every model tested on those 304 cases

- 85.5% solve rate vs. 20% by a group of physicians

- Its higher accuracy came with LOWER overall testing costs than lone LLMs or physicians pic.twitter.com/v3Eo2Dd2VE — Mustafa Suleyman (@mustafasuleyman) June 30, 2025

Συγκριτικά, η αντίστοιχη επίδοση ομάδας έμπειρων γιατρών ήταν περίπου 20%. Ωστόσο, πρέπει να σημειωθεί ότι, στο πλαίσιο της δοκιμής, οι γιατροί δεν είχαν πρόσβαση σε βιβλία ή συνεργάτες, κάτι που πιθανώς επηρέασε τα αποτελέσματα.

Η τεχνολογία βρίσκεται ήδη σε φάση ενσωμάτωσης σε προϊόντα της Microsoft όπως το Copilot AI και η μηχανή αναζήτησης Bing, τα οποία καθημερινά δέχονται πάνω από 50 εκατομμύρια ερωτήσεις για θέματα υγείας.

Ο Σουλεϊμάν λέει ότι πλησιάζουμε σε ένα σημείο όπου τα ΑΙ μοντέλα «δεν θα είναι απλώς ελαφρώς καλύτερα από τον άνθρωπο, αλλά θεαματικά πιο γρήγορα, πιο οικονομικά και πολύ πιο ακριβή». «Αυτό είναι πραγματικά επαναστατικό», πρόσθεσε.

Η κίνηση της Microsoft έρχεται σε μια περίοδο όπου η Google (μέσω της DeepMind) πρωτοστατεί στις εξελίξεις της ιατρικής ΑΙ. Πέρυσι, ο επικεφαλής της DeepMind, Ντέμης Χασάμπης, τιμήθηκε με Νόμπελ Χημείας για τη χρήση τεχνητής νοημοσύνης στην αποκωδικοποίηση των πρωτεϊνών, μια ανακάλυψη με τεράστιες βιοϊατρικές προεκτάσεις.

Microsoft AI built MAI-DxO to simulate a virtual panel of physicians with different approaches collaborating to find a diagnosis on each case. They also included the ability to set a budget to avoid infinite testing (higher costs, longer wait times, etc.). pic.twitter.com/ttyyZxXihH — Mustafa Suleyman (@mustafasuleyman) June 30, 2025

Παρά το γεγονός ότι το μοντέλο της OpenAI απέδωσε καλύτερα, ο Σουλεϊμάν επιμένει ότι η Microsoft δεν βασίζεται στο μοντέλο κάποιου συγκεκριμένου παρόχου:

«Πιστεύουμε εδώ και καιρό πως αυτά τα μοντέλα θα καταλήξουν να είναι σχεδόν εμπορεύματα. Η διαφορά δεν είναι στο μοντέλο, αλλά στον τρόπο που τα ενορχηστρώνουμε κι εκεί βρίσκεται το ανταγωνιστικό μας πλεονέκτημα».

Οι πιθανές εφαρμογές του «AI γιατρού» της Microsoft

Ο Ντόμινικ Κινγκ, πρώην επικεφαλής του τομέα υγείας στην DeepMind και πλέον στη Microsoft, χαρακτήρισε τα αποτελέσματα «τα πιο εντυπωσιακά που έχουμε δει ποτέ». Όπως είπε, η τεχνολογία αυτή θα μπορούσε να αποτελέσει μια νέα «είσοδο» στο σύστημα υγείας, μια πρώτη γραμμή πρόσβασης που καθοδηγεί τον ασθενή με αξιοπιστία.

Ένα ακόμη αξιοσημείωτο στοιχείο είναι ότι οι ΑΙ μονάδες εκπαιδεύτηκαν να λαμβάνουν υπόψη και το οικονομικό κόστος των διαγνωστικών επιλογών. Σε πολλές περιπτώσεις, πέτυχαν να μειώσουν σημαντικά τον αριθμό των εξετάσεων που απαιτούνταν για να φτάσουν σε ακριβές συμπέρασμα, οδηγώντας στην εξοικονόμηση εκατοντάδων χιλιάδων δολαρίων.

Ο Κινγκ τόνισε ότι το εργαλείο παραμένει πειραματικό, δεν έχει ακόμη αξιολογηθεί από ανεξάρτητους επιστήμονες (peer review), και δεν είναι έτοιμο για χρήση σε κλινικό περιβάλλον.

Ο καρδιολόγος Έρικ Τόπολ, διευθυντής του Scripps Research Translational Institute, χαρακτήρισε τη μελέτη ορόσημο για τη σχέση τεχνητής νοημοσύνης και ιατρικής: «Μπορεί η δοκιμή να μην έγινε σε πραγματικές συνθήκες, αλλά είναι η πρώτη σοβαρή ένδειξη ότι η γενετική ΑΙ μπορεί να προσφέρει ταυτόχρονα ακρίβεια και εξοικονόμηση κόστους».

MAI-DxO in action, tackling one of those complex cases: pic.twitter.com/ALpaBOomzO — Mustafa Suleyman (@mustafasuleyman) June 30, 2025

