Σύγχυση μεταξύ πληροφορίας και ευθυμογραφήματος, λάθος ημερομηνίες, κατασκευασμένες λεπτομέρειες... Οι εφαρμογές τεχνητής νοημοσύνης, όπως η ChatGPT, κάνουν λάθη σχεδόν μία φορά στις δύο, όταν ερωτώνται σχετικά με την επικαιρότητα, σύμφωνα με μεγάλη μελέτη που δημοσιοποιήθηκε σήμερα από τα ευρωπαϊκά δημόσια ραδιοφωνικά και τηλεοπτικά δίκτυα.
Το τεστ αυτό έγινε σε τέσσερις εφαρμογές τεχνητής νοημοσύνης που χρησιμοποιούνται ευρέως στον κόσμο για ενημέρωση: το ChatGPT (της εταιρείας OpenAI), το Copilot (Microsoft), το Gemini (Google) και το Perplexity.
Συνολικά, 45% των απαντήσεών τους περιείχαν "τουλάχιστον ένα σημαντικό πρόβλημα", ανεξαρτήτως γλώσσας και περιοχής, σύμφωνα με τη μελέτη που συντονίσθηκε από την Ευρωπαϊκή Ραδιοτηλεοπτική Ένωση (UER, EBU) και βασίσθηκε σε προηγούμενες εργασίες του BBC.
Μια απάντηση στις πέντε περιείχε μάλιστα "μείζονα λάθη", με παρωχημένες πληροφορίες, ακόμη και με "επινοημένες λεπτομέρειες".
Από τις τέσσερις εφαρμογές, το Gemini είχε τα πιο κακά αποτελέσματα: υπήρξαν "σημαντικά προβλήματα" στα τρία τέταρτα των απαντήσεών του, δηλαδή "υπερδιπλάσια απ' ό,τι στις άλλες εφαρμογές", κυρίως εξαιτίας των "μέτριων επιδόσεών" του στην ορθή αναφορά της πηγής μιας πληροφορίας.