Ten robot nauczył się mówić dzięki YouTube. Sztuczna inteligencja w akcji
Roboty humanoidalne są ciągle najczęściej mało ludzkie i dość sztywne. Amerykańscy naukowcy udowodnili właśnie, że przyszłość takich maszyn ma o wiele bardziej ludzką twarz. Stworzyli system, który uczy się mowy i śpiewu oraz obserwuje ludzi tak, jak robi to dziecko. To milowy krok w stronę robotów, z którymi naprawdę będziemy chcieli rozmawiać.

Postępy w rozwoju sztucznej inteligencji w ostatnich latach robią wrażenie. Kolejnym etapem byłoby „zamknięcie” tej niesamowitej mocy obliczeniowej w humanoidalnej oprawie. Eksperci czynią w tym zakresie pewne kroki. Zespół inżynierów z Uniwersytetu Columbia pod kierunkiem prof. Hoda Lipsona stworzył bardzo ważny element humanoidalnego robota. Swoje doświadczenia badacze opisali na łamach czasopisma „Science Robotics”.
Dlaczego roboty nas przerażają?
Podczas rozmowy twarzą w twarz prawie połowę uwagi skupiamy na ruchu ust rozmówcy. Niestety, współczesne roboty wciąż mają z tym elementem ogromny problem. Większość z nich nie ma twarzy wcale lub ich ruchy są sztywne i nienaturalne.
Stworzenie od podstaw sztucznej ludzkiej twarzy nie jest łatwe, bo jest animowana przez dziesiątki mięśni pod miękką skórą. Tymczasem humanoidalne twarze są zazwyczaj sztywne i działają według z góry zaprogramowanych i dość ograniczonych reguł. Ten brak naturalności wywołuje u nas gęsią skórkę, a nawet odrazę. Zjawisko to nazywamy „doliną niesamowitości”.
Wybaczamy robotom dziwny chód czy niezgrabne ruchy rąk. Jednak nawet najmniejszy błąd w mimice sprawia, że maszyna wydaje nam się martwa i niepokojąca. Aby roboty mogły pracować w edukacji czy medycynie, muszą nauczyć się ruszać ustami tak jak my.
Szkoła przed lustrem i YouTube
Zespół prof. Hoda Lipsona postanowił porzucić sztywne reguły programowania na rzecz nauki przez obserwację i rzucić wyzwanie sztywnym humanoidalnym twarzom. Uczeni stworzyli robota wyposażonego w 26 miniaturowych silników ukrytych pod elastyczną skórą. Jak nauczyć tak skomplikowany mechanizm płynnego ruchu? Naukowcy zastosowali dwuetapowy proces, który przypomina dorastanie człowieka.
Najpierw robot stanął przed lustrem. Robił tysiące losowych min i gestów oraz obserwował własne odbicie. Dzięki temu nauczył się, jak praca poszczególnych silników zmienia wygląd jego twarzy.
W drugim etapie maszyna zaczęła oglądać godziny nagrań z serwisu YouTube. Obserwowała, jak ruszają się usta ludzi podczas wypowiadania konkretnych dźwięków. Dzięki sztucznej inteligencji robot zaczął kojarzyć dźwięki z precyzyjnymi ruchami swoich silników.
Robot, który wydaje własny album
Efekt tych badań jest imponujący. Robot potrafi teraz synchronizować ruchy warg z mową w różnych językach. Co więcej, potrafi nawet śpiewać. Maszyna „wykonała” utwory ze swojego debiutanckiego albumu wygenerowanego przez AI pod tytułem „hello world_”. Robot tłumaczy nawet dźwięk bezpośrednio na ruch, nie znając nawet znaczenia wypowiadanych słów.
Twarde głoski, twardy orzech do zgryzienia dla robota
Oczywiście technologia nie jest jeszcze idealna. Naukowcy przyznają, że maszyna ma trudności z twardymi głoskami, takimi jak „b”, oraz dźwiękami wymagającymi mocnego ściągnięcia warg, jak „w”. Jednak każda interakcja z człowiekiem sprawia, że AI staje się lepsza. Eksperci uważają, że gdy połączymy tę technologię z modelami takimi jak ChatGPT, relacja między człowiekiem a maszyną zyska nową głębię.
Według autorów artykułu, ich robot nie opuścił jeszcze całkowicie „doliny niesamowitości”, ale znajduje się bardzo blisko jej przekroczenia. Mimo technicznych braków, twarz robota zaczyna już budować więź z człowiekiem. Prof. Hod Lipson przyznał, że mimo bycia „znużonym robotykiem”, nie potrafi powstrzymać uśmiechu, gdy maszyna spontanicznie uśmiecha się do niego.
Źródło: Science Robotics
Nasz autor
Szymon Zdziebłowski
Dziennikarz naukowy i podróżniczy, z wykształcenia archeolog śródziemnomorski. Przez wiele lat był związany z Serwisem Nauka w Polsce PAP. Opublikował m.in. dwa przewodniki turystyczne po Egipcie, a ostatnio – popularnonaukową książkę „Wielka Piramida. Tajemnice cudu starożytności” o największej egipskiej piramidzie. Miłośnik niewielkich, lokalnych muzeów. Uwielbia długie trasy rowerowe, szczególnie te prowadzące wzdłuż rzek. Lubi poznawać nieznane zakamarki Niemiec, zarówno na dwóch kółkach, jak i w czasie górskiego trekkingu.

