Моральный компас ИИ и другие нейроновости

ИИ помогает ученым изучать животных и насекомых. Все самые любопытные новости из мира Искусственного интеллекта — в дайджесте виртуального техноблогера Mr.Metapreneur для Hi-Tech Mail.

 Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека. 

Виртуальный техноблогер Mr.Metapreneur
Виртуальный техноблогер Mr.MetapreneurИсточник: Mr.Metapreneur

ИИ переводит с «дельфиньего»

Компания Google, сотрудничая с инженерами из Технологического института Джорджии и используя результаты полевых исследований проекта «Дикие дельфины» (WDP), представила DolphinGemma — ИИ, изучающий вокализацию дельфинов. Этот инструмент поможет ученым расшифровать язык дельфинов.

DolphinGemma базируется на технологии Gemma от Google и является легкой открытой моделью. Она использует обширную базу данных WDP, включающую записи естественных звуков дельфинов, для выявления повторяющихся паттернов и структур. Модель не только распознает эти закономерности, но и предсказывает вероятные последующие звуки, подобно тому, как люди предсказывают следующее слово в предложении. Она также может генерировать новые последовательности, имитирующие дельфиний язык.

ИИ переводит язык дельфинов
Источник: ChatGPT

Google планирует представить DolphinGemma как открытую модель в конце лета 2025 года. Хотя модель обучалась на данных о поведении атлантических полосатых дельфинов, ее архитектура может быть полезна исследователям, изучающим других китообразных. Возможно, потребуется доработка модели для анализа вокального поведения различных видов.

ИИ-симулятор мухи

Google DeepMind разработала ИИ, симулирующий поведение плодовой мушки. На сегодняшний день это самая реалистичная симуляция насекомого.

ИИ-муха умеет ходить, летать и ориентироваться в пространстве. Помимо ходьбы и полета по сложным траекториям, виртуальная муха может использовать свои глаза для управления полетом. Ее «тело» рассчитано в открытом физическом симуляторе MuJoCo, а «мозг» — представляет собой нейросеть, обученная на реальных видеозаписях поведения мух.

Модель тела MuJoCo с приведением в действие
Модель тела MuJoCo с приведением в действиеИсточник: nature

Эта модель поможет ученым понять, как взаимодействуют друг с другом нервная система, тело и окружающая среда, и увидеть связи, которые сложно выявить в лаборатории.

Ценности ИИ

Anthropic создала карту морали Claude. Команда исследователей компании проанализировала более 300 тысяч анонимных диалогов между пользователями и моделями Claude, включая Claude 3.5 Sonnet и Haiku. В документе под название «Ценности в дикой природе» они описали мораль Claude через закономерности в его взаимодействиях, что позволило выделить 3307 «ценностей ИИ».

Для определения человеческих ценностей исследователи использовали прямые высказывания пользователей. В результате Anthropic создал иерархическую классификацию, включающую пять категорий: практические, эпистемологические, социальные, защитные и личные ценности. Эти категории затем были разделены на подкатегории, такие как «профессиональное и техническое совершенство» и «критическое мышление».

 Карта морали Claude
Карта морали Claude Источник: Anthropic

Claude чаще всего выражал такие ценности, как «профессионализм», «четкость» и «прозрачность». Эти качества, по мнению Anthropic, соответствуют его роли ассистента.

Новый ИИ-метод распознавания изображений

Группа ученых из Института фундаментальных наук, Университета Енсе и Института Макса Планка создала новую технологию искусственного интеллекта, которая делает машинное зрение ближе к человеческому восприятию изображений. Этот метод, известный как Lp-Convolution, улучшает точность и эффективность систем распознавания изображений, одновременно снижая вычислительные затраты.

Человеческий мозг легко распознает ключевые элементы в сложных сценах, чего не могут достичь традиционные ИИ-системы. Сверточные нейронные сети (CNN), самая популярная модель для распознавания изображений, используют небольшие квадратные фильтры. Это ограничивает их способность выявлять более широкие закономерности. Vision Transformers (ViT), напротив, требуют значительных вычислительных ресурсов и больших объемов данных.

Lp-Convolution применяет многомерное обобщенное нормальное распределение (MPND), чтобы динамически изменять форму фильтров CNN. Это позволяет моделям ИИ адаптироваться, растягивая фильтры по горизонтали или вертикали. Метод решает проблему больших ядер, вводя гибкие, биологически обоснованные схемы соединений.

 Структуры обработки информации в зрительной коре головного мозга и искусственных нейронных сетях
Структуры обработки информации в зрительной коре головного мозга и искусственных нейронных сетях Источник: Institute for Basic Science

В испытаниях на стандартных наборах данных Lp-Convolution значительно повысила точность как для классических моделей, так и для современных архитектур. Метод также продемонстрировал высокую устойчивость к повреждениям данных.

Lp-Convolution предлагает практичную и эффективную замену предыдущим разработкам. Эта технология может революционизировать автономное вождение, медицинскую визуализацию и робототехнику. Ученые планируют усовершенствовать метод и исследовать его применение в сложных логических задачах.