DolphinGemma: model Google AI rozumie rozmowę delfinów

DolphinGemma: model Google AI rozumie rozmowę delfinów

Google opracowało model sztucznej inteligencji o nazwie DolphinGemma, aby rozszyfrować sposób komunikacji delfinów i pewnego dnia ułatwić komunikację międzygatunkową.

Skomplikowane kliknięcia, gwizdy i impulsy odbijające się echem w podwodnym świecie delfinów od dawna fascynują naukowców. Marzeniem było zrozumienie i rozszyfrowanie wzorców w ich złożonych wokalizacjach.

Firma Google, współpracując z inżynierami z Georgia Institute of Technology i wykorzystując badania terenowe Wild Dolphin Project (WDP), zaprezentowała DolphinGemma, aby pomóc w realizacji tego celu.

Ogłoszony w okolicach Narodowego Dnia Delfinów, podstawowy model AI stanowi nowe narzędzie w dążeniu do zrozumienia komunikacji waleni. Wyszkolony specjalnie do nauki struktury dźwięków delfinów, DolphinGemma może nawet generować nowe, podobne do delfinów sekwencje audio.

Badania terenowe i dane akustyczne

Przez dziesięciolecia Wild Dolphin Project – działający od 1985 roku – prowadził najdłuższe na świecie ciągłe podwodne badania delfinów w celu dogłębnego zrozumienia dźwięków specyficznych dla kontekstu, takich jak:

  • Charakterystyczne gwizdy – unikalne identyfikatory, podobne do imion

  • Gwizdy impulsowe – związane z konfliktami lub agresją

  • Kliknięcia – obserwowane podczas zalotów lub ścigania rekinów

Celem WDP jest odkrycie reguł gramatycznych i struktur, które mogą oznaczać formę języka.

DolphinGemma: AI dla dźwięków waleni

Analiza ogromnej ilości i złożoności komunikacji delfinów to zadanie idealne dla sztucznej inteligencji.

DolphinGemma, opracowany przez Google, wykorzystuje specjalistyczne technologie audio, takie jak tokenizator SoundStream, aby efektywnie reprezentować dźwięki. Dane są przetwarzane przez model sekwencyjny oparty na rodzinie Google Gemma, pokrewnej z modelami Gemini.

Model działa jako system audio-in, audio-out i może działać nawet na smartfonach Google Pixel, których używa WDP do zbierania danych.

Uczy się identyfikować powtarzające się wzorce i struktury, a także przewidywać kolejne dźwięki – podobnie jak ludzkie modele językowe przewidują następne słowo.

System CHAT i interakcja

Równolegle badany jest system CHAT (Cetacean Hearing Augmentation Telemetry) – mający na celu stworzenie prostego wspólnego słownictwa, zamiast tłumaczenia złożonego języka.

CHAT tworzy syntetyczne gwizdy, które kojarzone są z obiektami, z którymi delfiny lubią się bawić (np. szaliki, wodorosty). Gdy badacze demonstrują takie skojarzenie, delfiny mają naśladować dźwięki, by o nie prosić.

DolphinGemma i CHAT mogą współpracować – dane z AI pomogą rozpoznać naturalne wzorce i zbudować realną komunikację.

Cel: globalne narzędzie badawcze

Celem jest wyposażenie badaczy na całym świecie w potężne narzędzia do analizy akustycznych danych, przyspieszając globalny postęp. Przechodzimy od biernego słuchania do aktywnych prób komunikacji, przybliżając możliwość porozumienia między gatunkami.

Źródło:
https://www.artificialintelligence-news.com/news/dolphingemma-google-ai-model-understands-dolphin-chatter/

Related posts

Narzędzie AI do wykrywania padaczki wykrywa zmiany w mózgu przeoczone przez lekarzy

Wielcy branży AI w Paryżu. Szansa dla Polski

Szokujący postęp w chińskiej sztucznej inteligencji o nazwie DeepSeek powoduje gwałtowny spadek akcji w USA