Междисциплинарная группа ученых запустила проект по расшифровке звуков, издаваемых кашалотами. Инициатива называется Project CETI (Cetacean Translation Initiative). Цель – создать искусственный интеллект, способный расшифровать щелчки, которые кашалоты используют для общения друг с другом, также известные как «коды». Для этого исследователи вооружились программой обработки естественного языка NLP (Natural-Language Processing) – разновидностью ИИ, заточенной на анализ письменной и устной речи.
Цели проекта многообещающие, но есть препятствие: для него нужны данные. Очень много данных. Первая цель CETI – собрать четыре миллиарда кодов кашалотов. Прежде в рамках проекта Dominica Sperm Whale Project уже было собрано около 100 000 кодов. Для сравнения, GPT-3 – продвинутая модель обработки естественного языка – проходила обучение на 175 миллиардах человеческих слов.
Далее ученым потребуется поместить собранные коды в контекст. В конце концов, слова без контекста не имеют никакого значения. А для этого понадобятся годы исследований естественной среды обитания кашалотов.
Если же проект CETI успешно дойдет до финала, модель «китовьего» языка могла бы навсегда изменить восприятие людьми природы и нашего взаимодействия с ней. «Если мы вдруг обнаружим, что целая китовья цивилизация находится у нас под носом – возможно, это приведет к сдвигу в отношении к окружающей среде и к большему уважению к животному миру», – говорит руководитель отдела машинного обучения проекта CETI Майкл Бронштейн.