Τέσσερα από τα έξι προβλήματα που τους τέθηκαν στην Διεθνή Μαθηματική Ολυμπιάδα που πραγματοποιήθηκε από τις 11 ως τις 22 Ιουλίου στο Πανεπιστήμιο του Μπαθ (University of Bath) στο Ηνωμένο Βασίλειο έλυσαν δύο μοντέλα Τεχνητής Νοημοσύνης του ερευνητικού εργαστηρίου της Google, DeepMind.
Πρόκειται για τα μοντέλα AlphaProof και AlphaGeometry 2 που έλυσαν τέσσερα από τα έξι προβλήματα που τους τέθηκαν στον φετινό διεθνή διαγωνισμό για μαθητές Λυκείου.
Η πρώτη έκδοση του AlphaGeometry είχε ήδη καταφέρει να λύσει 25 προβλήματα γεωμετρίας της Ολυμπιάδας από ένα σύνολο 30 επιλεγμένων ασκήσεων, έγραψε το επιστημονικό περιοδικό Nature τον Ιανουάριο.
Τα μεγάλα γλωσσικά μοντέλα, κορυφαία προϊόντα της ΤΝ, έχουν μεγάλη δυσκολία σε τεστ λογικής, σύμφωνα με μελέτη που δημοσιεύθηκε τον Ιούνιο στο περιοδικό Open Science της Βρετανικής Βασιλικής Εταιρείας.
We’re presenting the first AI to solve International Mathematical Olympiad problems at a silver medalist level.🥈
— Google DeepMind (@GoogleDeepMind) July 25, 2024
It combines AlphaProof, a new breakthrough model for formal reasoning, and AlphaGeometry 2, an improved version of our previous system. 🧵 https://t.co/U0OFXBia8n pic.twitter.com/h2mcLLRJjk
Αυτή διαπίστωσε ότι το ChatGPT 3.5 και 4 της OpenAI, το Bard της Google, το Claude 2 της Anthropic και τρεις εκδόσεις του Llama της Meta απάντησαν αντιφατικά και βασίστηκαν συχνά σε παράλογους συλλογισμούς.
Η Διεθνής Μαθηματική Ολυμπιάδα διεξάγεται από το 1959. Προκαλεί το ενδιαφέρον μαθητών Λυκείου (και μερικές φορές ορισμένους εξαιρετικούς μαθητές) με αγάπη και ταλέντο στα μαθηματικά, οι οποίοι επιλέγονται από περίπου 100 χώρες.
For the 1st time, an AI has achieved a medal score in the International Mathematical Olympiad, the hardest maths test in the world for students.
— Alex Wilkins (@AlexWilkins22) July 25, 2024
A new AI from Google DeepMind, called AlphaProof, is at the silver medal mark and just 1 point below gold https://t.co/PREUvWwVdy