Reklama

W ramach projektu FrontierMath powstał unikatowy egzamin z matematyki, zaprojektowany specjalnie do testowania możliwości sztucznej inteligencji. Jego celem było stworzenie zestawu zadań tak trudnych, że żaden człowiek nie byłby w stanie samodzielnie rozwiązać wszystkich problemów. W przedsięwzięciu uczestniczył dr Bartosz Naskręcki z Uniwersytetu im. Adama Mickiewicza w Poznaniu.

Polak stworzył zadanie nie do przejścia

Dr Naskręcki stworzył jedno z zadań morderczego testu matematycznego. – Zaproszono mnie do przygotowania zadania. Odpowiedzią miała być bardzo duża liczba, aby model nie mógł jej przypadkiem zgadnąć. Włożyłem w to zadanie całą moją wiedzę ekspercką zgromadzoną podczas wszystkich lat studiów i pracy – opowiadał matematyk Polskiej Agencji Prasowej.

Dr Bartosz Naskręcki, fot: Uniwersytet im. Adama Mickiewicza w Poznaniu
Dr Bartosz Naskręcki, fot: Uniwersytet im. Adama Mickiewicza w Poznaniu

Egzamin FrontierMath: co to takiego?

FrontierMath powstał dlatego, że dotychczasowe testy przestały być wyzwaniem dla coraz lepszych modeli AI. Najnowsze systemy, rozwijane m.in. przez Google DeepMind czy OpenAI, radzą sobie już bez trudu z zadaniami na poziomie matury. Potrzebne były więc nowe narzędzia matematyczne.

Projekt, koordynowany przez firmę Epoch AI, składa się z kilku poziomów trudności. Dr Naskręcki współtworzył najtrudniejszy z nich – Tier 4, obejmujący 50 zadań z pięciu działów matematyki:

  • teorii liczb,
  • topologii,
  • kombinatoryki,
  • analizy,
  • geometrii algebraicznej.

Prace nad egzaminem odbywały się w Berkeley w USA, gdzie trzydziestu ekspertów z całego świata przez dwa dni tworzyło i testowało zadania na najpotężniejszych modelach AI. Problemy były wielokrotnie modyfikowane, by uniemożliwić maszynom szybkie znalezienie rozwiązania w dostępnych dla nich zasobach wiedzy.

Ostatecznie powstało 50 arcytrudnych pytań, z których aktualne modele potrafią – póki co – rozwiązać zaledwie 4. Według dr. Naskręckiego nawet wybitny matematyk potrzebowałby miesięcy, by zorientować się, jak w ogóle podejść do większości problemów. – Nie sądzę, by na świecie istniał matematyk, który rozwiązałby wszystkie 50 problemów z tego zestawu – dodaje Naskręcki.

Czy AI może stać się lepszym matematykiem niż ludzie?

Firmy AI mogą podłączać swoje modele do infrastruktury Epoch AI i egzaminować je. Zdaniem badacza za 2–3 lata modele będą w stanie rozwiązać większość tych zadań, co pozwoli mówić o nich jako o „nieźle rozumujących matematykach”.

Jednak zasadnicze ograniczenie pozostanie: sztuczna inteligencja potrafi świetnie łączyć istniejącą wiedzę, lecz nie tworzy nowych koncepcji. Dlatego odkrycia na miarę dowodu hipotezy Riemanna wciąż pozostaną domeną ludzi.

Dr Naskręcki podkreśla, że rozwój AI wymusza zmianę myślenia o edukacji. Tradycyjny model szkoły, nastawiony na schematyczne działania, traci sens. Kluczowa staje się „płynna inteligencja” – zdolność do kreatywnego i nowatorskiego rozwiązywania problemów. To obszar, w którym człowiek wciąż przewyższa maszyny. Zdaniem matematyka kariera naukowca nadal ma przyszłość, lecz jej charakter ulegnie transformacji: nie będzie już w nim miejsca na drobne uzupełnianie istniejących teorii – kluczowe stanie się stawianie śmiałych pytań i tworzenie oryginalnych rozwiązań.

Źródło: Nauka w Polsce

Nasza autorka

Magdalena Rudzka

Dziennikarka „National Geographic Traveler" i „Kaleidoscope". Przez wiele lat również fotoedytorka w agencjach fotograficznych i magazynach. W National-Geographic.pl pisze przede wszystkim o przyrodzie. Lubi podróże po nieoczywistych miejscach, mięso i wino.
Reklama
Reklama
Reklama