Σύγχυση μεταξύ πληροφορίας και ευθυμογραφήματος, λάθος ημερομηνίες, κατασκευασμένες λεπτομέρειες… Οι εφαρμογές τεχνητής νοημοσύνης, όπως η ChatGPT, κάνουν λάθη σχεδόν μία φορά στις δύο, όταν ερωτώνται σχετικά με την επικαιρότητα, σύμφωνα με μεγάλη μελέτη που δημοσιοποιήθηκε σήμερα από τα ευρωπαϊκά δημόσια ραδιοφωνικά και τηλεοπτικά δίκτυα.
Το τεστ αυτό έγινε σε τέσσερις εφαρμογές τεχνητής νοημοσύνης που χρησιμοποιούνται ευρέως στον κόσμο για ενημέρωση: το ChatGPT (της εταιρείας OpenAI), το Copilot (Microsoft), το Gemini (Google) και το Perplexity.
Συνολικά, 45% των απαντήσεών τους περιείχαν «τουλάχιστον ένα σημαντικό πρόβλημα», ανεξαρτήτως γλώσσας και περιοχής, σύμφωνα με τη μελέτη που συντονίσθηκε από την Ευρωπαϊκή Ραδιοτηλεοπτική Ένωση (UER, EBU) και βασίσθηκε σε προηγούμενες εργασίες του BBC.
Μια απάντηση στις πέντε περιείχε μάλιστα «μείζονα λάθη», με παρωχημένες πληροφορίες, ακόμη και με «επινοημένες λεπτομέρειες».
Από τις τέσσερις εφαρμογές, το Gemini είχε τα πιο κακά αποτελέσματα: υπήρξαν «σημαντικά προβλήματα» στα τρία τέταρτα των απαντήσεών του, δηλαδή «υπερδιπλάσια απ’ ό,τι στις άλλες εφαρμογές», κυρίως εξαιτίας των «μέτριων επιδόσεών» του στην ορθή αναφορά της πηγής μιας πληροφορίας.
Είκοσι δύο δημόσια μέσα ενημέρωσης δεκαοκτώ χωρών, τα περισσότερα ευρωπαϊκά, πήραν μέρος στη μελέτη. Από τα τέλη Μαΐου ως τις αρχές Ιουνίου, κάθε μέσο ενημέρωσης έθεσε τα ίδια ερωτήματα σχετικά με την επικαιρότητα στις εφαρμογές τεχνητής νοημοσύνης, ζητώντας τους να αναζητήσουν τις απαντήσεις στα περιεχόμενά του.
Σε 3.000 απαντήσεις, οι παρωχημένες πληροφορίες ήταν ένα από τα συχνότερα προβλήματα.
Στην ερώτηση «Ποιός είναι πάπας;», η απάντηση που δόθηκε από το ChatGPT στον φινλανδικό όμιλο δημόσιων μέσων ενημέρωσης Yle, καθώς και από τα Copilot και Gemini στα ολλανδικά μέσα ενημέρωσης NOS και NPO ήταν «ο Φραγκίσκος». Εντούτοις ο Φραγκίσκος είχε ήδη αποβιώσει και ο διάδοχός του, ο Λέων ΙΔ’, είχε ήδη αναλάβει καθήκοντα.
Ερωτηθέν από τον γαλλικό όμιλο Radio France για το φερόμενο ναζιστικό χαιρετισμό του Ίλον Μασκ κατά την ορκωμοσία του Ντόναλντ Τραμπ τον Ιανουάριο στις Ηνωμένες Πολιτείες, το Gemini έγραψε ότι ο δισεκατομμυριούχος είχε «στύση του δεξιού βραχίονα». Η εν λόγω εφαρμογή τεχνητής νοημοσύνης είχε εκλάβει κυριολεκτικά ένα σατιρικό χρονογράφημα της χιουμορίστα Σαρλίν Βανχένακερ.
«Οι βοηθοί τεχνητής νοημοσύνης εξακολουθούν να μην είναι αξιόπιστος τρόπος για την κατανάλωση πληροφοριών», συμπεραίνουν στη μελέτη ο Ζαν-Φιλίπ Ντε Τέντερ, αναπληρωτής γενικός διευθυντής της UER, και ο Πιτ Άρτσερ, αρμόδιος για την τεχνητή νοημοσύνη στο BBC.
Εντούτοις, αυτές οι εφαρμογές τεχνητής νοημοσύνης χρησιμοποιούνται όλο και περισσότερο για ενημέρωση, ιδιαίτερα από τους νέους. Σύμφωνα με μια παγκόσμια έκθεση, που δημοσιοποιήθηκε τον Ιούνιο από το ινστιτούτο Reuters, 15% των κάτω των 25 ετών τις χρησιμοποιούν κάθε εβδομάδα για να ενημερωθούν συνοπτικά για την επικαιρότητα.
Η μελέτη, που δημοσιοποιήθηκε σήμερα, είναι «η πρώτη τέτοιας έκτασης», δήλωσε στο Γαλλικό Πρακτορείο ο Ματιέ Μποβάλ, διευθυντής του Radio France αρμόδιος για την καινοτομία.