W ostatnim czasie coraz częściej możliwości sztucznej inteligencji wykorzystywane są również przez badaczy dawnych cywilizacji. Ogromne możliwości obliczeniowe komputerów umożliwiają przetwarzanie danych na niespotykaną do tej pory skalę.

Tabliczki klinowe – biblioteka Bliskiego Wschodu

W czasie wykopalisk na terenie Syrii, Jordanii, Iraku czy innych krajów w tym rejonie archeolodzy wydobyli olbrzymią liczbę starożytnych „ksiąg”. Kilka tysięcy lat temu nie znano tam papieru, ani papirusu w przeciwieństwie do starożytnego Egiptu. Pisano na niewielkich glinianych tabliczkach. Znaki odciskano za pomocą rylca. Stąd wzięła się nazwa stosowanego systemu zapisu – klinowe. 

Szacuje się, że znanych tabliczek jest nawet milion. Wiele z nich do tej pory nie zostało odczytanych. Ale nie z tego powodu, że nie jest to możliwe. Po prostu ekspertów władających różnymi starożytnymi językami, które zapisywano pismem klinowym, jest stosunkowo niewielu.

I w tym miejscu wkracza do pomocy sztuczna inteligencja. Zespół ekspertów z Uniwersytet Marcina Lutra w Halle i Wittenberdze (MLU), Uniwersytetu Jana Gutenberga w Moguncji i Uniwersytetu Nauk Stosowanych w Moguncji w Niemczech zaprezentował swoje propozycje dotyczące wykorzystania technologii cyfrowych na konferencji „Graphics and Cultural Heritage Conference” we Włoszech.

Niektóre tabliczki mierzą tylko kilka centymetrów / Fot. Uni Halle / Maike Glöckner

– Można na nich (tabliczkach – przyp. red.) znaleźć wszystko: od list zakupów po orzeczenia sądowe. Tabliczki dają wgląd w przeszłość ludzkości sprzed kilku tysiącleci. Są one jednak mocno zniszczone i przez to trudne do rozszyfrowania nawet dla wprawnych oczu – mówi jeden z autorów metody, Hubert Mara z MLU.

Pismo klinowe jest wielowymiarowe

Naukowcy zwrócili uwagę na to, że pismo klinowe jest wielowymiarowe. By je odczytać, należy ustawić je pod odpowiednim kątem. Dlatego wykorzystali skanowanie trójwymiarowe (3D) sprzężone z oprogramowaniem. Zdaniem niemieckich ekspertów taki system daje bardziej wiarygodne rezultaty niż te stosowane do tej pory. Eksperci przetestowali nowe narzędzie na prawie 2000 tabliczek z jednej z niemieckich kolekcji. 

Zastosowany system sztucznej inteligencji działa na tej samej zasadzie, co oprogramowanie OCR (optyczne rozpoznawanie znaków), które konwertuje obrazy pisma i tekstu na tekst nadający się do odczytu maszynowego. Ma to wiele zalet. Po przekonwertowaniu na zapis cyfrowy pismo można łatwiej odczytać lub znaleźć szukane słowa i frazy.

– OCR zwykle działa ze zdjęciami lub skanami. Nie stanowi to problemu w przypadku atramentu na papierze lub pergaminie. W przypadku tabliczek z pismem klinowym sytuacja jest jednak trudniejsza, ponieważ światło i kąt widzenia mają duży wpływ na to, w jaki sposób zidentyfikować niektóre znaki – dodaje Ernst Stötzner z MLU, który opracował nowy system sztucznej inteligencji.

Zespół ekspertów „przeszkolił” nowe oprogramowanie sztucznej inteligencji przy użyciu trójwymiarowych skanów i dodatkowych danych. System AI zdołał następnie bezbłędnie rozpoznać symbole na tabliczkach. – Byliśmy zaskoczeni, że nasz system działa dobrze nawet ze zdjęciami, które są w rzeczywistości gorszym materiałem źródłowym – zaznacza Stötzner. 

Z zaprezentowanych informacji wynika, że system poprawnie spisuje znaki klinowe, dostrzega je tam, gdzie człowiek ma trudności. Oznacza to, że przekład jest już w rękach ekspertów. Tyle, że ich praca jest zdecydowanie bardziej ułatwiona.

Proces skanowania 3D tabliczki z pismem klinowym / Fot. Uni Halle / Maike Glöckner

Sztuczna inteligencja kontra tabliczki

To nie pierwszy pomysł na zastosowanie uczenia maszynowego do analizy tekstów klinowych. W tym roku swoją metodę zaprezentowali badacze z Izraela. Ich pomysł był jednak inny. 

Sztuczna inteligencja tłumaczyła na język angielski transliterację pisma zwartego na tabliczkach. Oznacza to, że inni specjaliści, znający starożytne języki najpierw przyjrzeli się tabliczkom i próbowali sami odczytać znaki i zapisać je w alfabecie łacińskim. Co prawda eksperci z Izraela testowali swój system również bezpośrednio na tabliczkach, ale lepiej radził sobie z transliteracją.

Źródło: Eurographics Workshop on Graphics and Cultural Heritage