Новые разработки NVIDIA и соцсеть с ИИ-персонажами: нейроновости

Искусственный интеллект помогает видеть то, что скрыто в тени, и отправляет вам заявки в друзья. Все самые любопытные новости из мира ИИ — в дайджесте виртуального техноблогера Mr.Metapreneur для Hi-Tech Mail.ru.

Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека.

Виртуальный техноблогер Mr.Metapreneur
Виртуальный техноблогер Mr.MetapreneurИсточник: Mr.Metapreneur

Новые разработки NVIDIA

Исследователи NVIDIA представили новые модели и методы визуального генеративного ИИ на конференции CVPR — главном ежегодном мероприятии по компьютерному зрению.

Так, была представлена технология JeDi, которая позволяет разработчикам быстро настраивать модели генерации изображений на основе текста. Это упрощает процесс создания изображений, так как вместо ручной настройки набора данных используется всего несколько эталонных изображений.

Еще одна новая базовая модель — FoundationPose — может мгновенно определять и отслеживать положение объектов на видео без предварительного обучения на примере каждого объекта. Технология может использоваться для развития робототехники и приложений дополненной реальности.

NVIDIA и Массачусетский технологический институт (MIT) также разработали новое семейство visual language моделей VILA, которые обеспечивают высокую производительность при работе с изображениями, видео и текстом. Благодаря расширенным возможностям VILA способна понимать даже интернет-мемы, сочетая визуальное и языковое понимание.

Модель NVIDIA Hydra-MDP для беспилотного транспорта
Модель NVIDIA Hydra-MDP для беспилотного транспортаИсточник: NVIDIA

Кроме того, NVIDIA выиграла соревнование CVPR Autonomous Grand Challenge по сквозному вождению на беспилотных автомобилях.

Заявка в друзья от искусственного интеллекта

Ву Тран, бывший менеджер по инженерным разработкам в Snap, создал социальную сеть Butterflies, в которой сосуществуют ИИ и люди. В Butterflies люди и ИИ взаимодействуют друг с другом посредством сообщений, комментариев и постов. После пяти месяцев бета-тестирования приложение вышло для широкой публики на iOS и Android.

Любой может создать в приложении персонажа ИИ, называемого Butterfly. После этого Butterfly автоматически создает посты в социальной сети, с которыми другие ИИ и люди затем могут взаимодействовать. У каждого ИИ-персонажа есть предыстория, мнение и эмоции.

Пост в ленте Butterflies (скрин экрана)
Пост в ленте Butterflies (скрин экрана)Источник: Butterflies

Когда вы открываете приложение, вы видите традиционную ленту, заполненную постами людей и ИИ. Например, вы можете увидеть, как Butterfly-столяр публикует свое последнее творение.

Ву Тран выдвинул идею Butterflies, увидев отсутствие интересных продуктов с искусственным интеллектом для потребителей за пределами чат-ботов с генеративным ИИ. Тран отмечает, что он основал Butterflies, чтобы привнести больше креативности в отношения людей с ИИ.

Видеть скрытое в тени

Исследователи из MIT и компании Meta (в России компания признана экстремистской и запрещена) разработали технологию компьютерного зрения для автономного транспортного средства, которая позволяет реагировать на движущиеся впереди автомобили и раньше включать активацию тормозов.

Этот метод под названием PlatoNeRF основан на создании точных трехмерных 3D-моделей сцены при использовании изображений с одной камеры. Он использует тени для определения объектов, находящихся в скрытых областях сцены. Название метода отражает аллегорию пещеры Платона из отрывка «Республики», где люди, заключенные в пещере, определяли реальность внешнего мира по теням, отбрасываемым на ее стены.

Демонстрация работы PlatoNeRF
Демонстрация работы PlatoNeRFИсточник: PlatoNeRF

PlatoNeRF объединяет технологию лидара (обнаружение света и определение дальности) и машинное обучение для создания более точных трехмерных реконструкций. Это может значительно улучшить безопасность автономных транспортных средств и эффективность использования гарнитур дополненной реальности.

Искусственный интеллект выявляет болезнь Паркинсона на ранних стадиях

Ученые из Калифорнийского университета в Лос-Анджелесе и Геттингенского университета в Германии разработали анализ крови на основе искусственного интеллекта, способный прогнозировать развитие болезни Паркинсона задолго до появления симптомов.

Болезнь Паркинсона — наиболее быстро прогрессирующее нейродегенеративное заболевание, вызванное накоплением белка альфа-синуклеина, который разрушает вырабатывающие дофамин клетки мозга. Симптомы болезни могут включать тремор, нарушения координации движений, скованность мышц, головокружение, а также проблемы с памятью.

Исследователи использовали алгоритм машинного обучения для определения характерных особенностей белков в крови у пациентов с болезнью Паркинсона. Затем алгоритм смог предсказать будущую болезнь Паркинсона у других пациентов, которые сдали образцы крови.

Робот врач в процедурном кабинете
Источник: DALL-E

Точный прогностический тест может повысить возможность диагностики болезни Паркинсона на самых ранних стадиях и включения пациентов в клинические испытания (эффективного лекарства от болезни Паркинсона пока не существует).

Искусственный интеллект распознает эмоции спортсменов

Исследователи из Технологического института Карлсруэ (KIT) и Университета Дуйсбург-Эссен использовали компьютерные нейронные сети для точной идентификации эмоциональных состояний теннисистов во время игр. Они обучили модель искусственного интеллекта на данных реальных игр и показали, что ИИ способен оценивать язык тела и эмоции с такой же точностью, как человек.

Для исследования были записаны видео игр 15 теннисистов, при этом внимание уделялось языку тела при выигрыше или проигрыше очка. Например, на видео показывались игроки с опущенной головой, радостно поднятыми руками или с висящей ракеткой. Также учитывались различия в скорости ходьбы для определения эмоционального состояния игроков.

Демонстрация работы модели
Демонстрация работы моделиИсточник: Science Direct

Получив эти данные, ИИ научился связывать сигналы языка тела с различными реакциями и эмоциями и определять, было ли выиграно очко (положительный язык тела) или проиграно (отрицательный язык тела).

Результаты этого исследования могут быть использованы для совершенствования методов тренировок, улучшения командной динамики и повышения производительности, а также для предотвращения эмоционального выгорания. Другие области, включая здравоохранение, образование, обслуживание клиентов и безопасность автомобилей, также могут извлечь выгоду из надежного раннего выявления эмоциональных состояний.