DolphinGemma: model Google AI rozumie rozmowę delfinów
Google opracowało model sztucznej inteligencji o nazwie DolphinGemma, aby rozszyfrować sposób komunikacji delfinów i pewnego dnia ułatwić komunikację międzygatunkową.
Skomplikowane kliknięcia, gwizdy i impulsy odbijające się echem w podwodnym świecie delfinów od dawna fascynują naukowców. Marzeniem było zrozumienie i rozszyfrowanie wzorców w ich złożonych wokalizacjach.
Firma Google, współpracując z inżynierami z Georgia Institute of Technology i wykorzystując badania terenowe Wild Dolphin Project (WDP), zaprezentowała DolphinGemma, aby pomóc w realizacji tego celu.
Ogłoszony w okolicach Narodowego Dnia Delfinów, podstawowy model AI stanowi nowe narzędzie w dążeniu do zrozumienia komunikacji waleni. Wyszkolony specjalnie do nauki struktury dźwięków delfinów, DolphinGemma może nawet generować nowe, podobne do delfinów sekwencje audio.
Badania terenowe i dane akustyczne
Przez dziesięciolecia Wild Dolphin Project – działający od 1985 roku – prowadził najdłuższe na świecie ciągłe podwodne badania delfinów w celu dogłębnego zrozumienia dźwięków specyficznych dla kontekstu, takich jak:
-
Charakterystyczne gwizdy – unikalne identyfikatory, podobne do imion
-
Gwizdy impulsowe – związane z konfliktami lub agresją
-
Kliknięcia – obserwowane podczas zalotów lub ścigania rekinów
Celem WDP jest odkrycie reguł gramatycznych i struktur, które mogą oznaczać formę języka.
DolphinGemma: AI dla dźwięków waleni
Analiza ogromnej ilości i złożoności komunikacji delfinów to zadanie idealne dla sztucznej inteligencji.
DolphinGemma, opracowany przez Google, wykorzystuje specjalistyczne technologie audio, takie jak tokenizator SoundStream, aby efektywnie reprezentować dźwięki. Dane są przetwarzane przez model sekwencyjny oparty na rodzinie Google Gemma, pokrewnej z modelami Gemini.
Model działa jako system audio-in, audio-out i może działać nawet na smartfonach Google Pixel, których używa WDP do zbierania danych.
Uczy się identyfikować powtarzające się wzorce i struktury, a także przewidywać kolejne dźwięki – podobnie jak ludzkie modele językowe przewidują następne słowo.
System CHAT i interakcja
Równolegle badany jest system CHAT (Cetacean Hearing Augmentation Telemetry) – mający na celu stworzenie prostego wspólnego słownictwa, zamiast tłumaczenia złożonego języka.
CHAT tworzy syntetyczne gwizdy, które kojarzone są z obiektami, z którymi delfiny lubią się bawić (np. szaliki, wodorosty). Gdy badacze demonstrują takie skojarzenie, delfiny mają naśladować dźwięki, by o nie prosić.
DolphinGemma i CHAT mogą współpracować – dane z AI pomogą rozpoznać naturalne wzorce i zbudować realną komunikację.
Cel: globalne narzędzie badawcze
Celem jest wyposażenie badaczy na całym świecie w potężne narzędzia do analizy akustycznych danych, przyspieszając globalny postęp. Przechodzimy od biernego słuchania do aktywnych prób komunikacji, przybliżając możliwość porozumienia między gatunkami.