Mr.Metapreneur — виртуальный техноблогер. Ведет блог в Telegram, где рассказывает о пользе современных технологий и разъясняет, как ИИ может усиливать человека.
ИИ распознает язык жестов
Исследователи из Колледжа инженерии и компьютерных наук Атлантического университета Флориды провели первое в своем роде исследование, посвященное распознаванию жестов американского языка жестов (ASL) с помощью компьютерного зрения.
Они собрали уникальный набор данных, состоящий из 29 820 статичных изображений жестов ASL. С помощью MediaPipe, программы для захвата движений, основанной на нейросети, каждое изображение было помечено 21 ключевой точкой на руке. Это обеспечило получение детальной пространственной информации о ее структуре и положении. Это, в свою очередь, позволило повысить точность модели глубокого обучения YOLOv8, которую обучили исследователи. Это дало ей возможность лучше распознавать едва заметные различия в жестах рук.
Результаты исследования показали, что модель работает с точностью 98%. В дальнейшем ученые планируют расширить свой набор данных, включив в него более разнообразные формы рук и жестов. Это позволит улучшить способность модели различать жесты, которые могут казаться визуально похожими, и тем самым повысить точность распознавания. Кроме того, одной из приоритетных задач станет оптимизация модели для ее развертывания на периферийных устройствах, чтобы она могла работать в реальном времени даже в условиях ограниченных ресурсов.
ИИ в роли школьного учителя
Национальная сеть чартерных школ в Остине предлагает учащимся с 1 по 12 классы обучение с использованием искусственного интеллекта. Компания «2 Hour Learning» предлагает ускоренные занятия с помощью приложений, которые, как утверждается, обеспечивают обучение в два раза быстрее, чем в традиционных классах.
По словам представителей компании, система работает для 80−90% детей и стабильно демонстрирует результаты на уровне 90% по шкале NWEA (международная система оценки знаний). Однако, помимо подготовки учеников к национальным стандартизированным тестам, одной из очевидных целей «2 Hour Learning» является устранение учителей из классов.
Система искусственного интеллекта, используемая в «2 Hour Learning», не основана на GPT-модели OpenAI или Google Gemini. Однако информация о том, кто создал эту технологию и какие наборы данных использовались, пока не разглашается.
ИИ расшифровывает РНК растений
В рамках исследовательского сотрудничества была запущена революционная модель искусственного интеллекта (ИИ), предназначенная для расшифровки последовательностей и структурных закономерностей, формирующих генетический «язык» растений, или проще говоря их РНК. Как и ее более известный химический родственник ДНК, РНК является важной молекулой во всех организмах, отвечающей за перенос генетической информации в своих последовательностях и структурах.
Модель под названием Plant RNA-FM является первой в своем роде и была разработана в результате сотрудничества исследователей растений из Центра Джона Иннеса и специалистов по информатике из Университета Эксетера. Модель обучена на огромном массиве данных, состоящем из 54 миллиардов фрагментов РНК, которые составляют генетический алфавит 1124 видов растений. При создании PlantRNA-FM исследователи использовали методологию, с помощью которой модели искусственного интеллекта, такие, как ChatGPT, обучаются понимать человеческий язык. Модель искусственного интеллекта была обучена языку растений путем изучения информации об РНК различных видов растений по всему миру, чтобы получить полное представление о том, как РНК работает в растительном мире.
Подобно тому, как ChatGPT может понимать человеческую речь и отвечать на нее, PlantRNA-FM научился понимать грамматику и логику последовательностей и структур РНК.
По словам создателей модели, это интеллектуальный технологический прорыв, который может способствовать открытиям и инновациям в области растениеводства и, возможно, в изучении беспозвоночных и бактерий.
ИИ для прогнозирования биомолекулярных структур
Ученые Массачусетского технологического института выпустили мощную модель ИИ с открытым исходным кодом под названием Boltz-1, которая может значительно ускорить биомедицинские исследования и разработку лекарств.
Boltz-1, разработанная командой исследователей из MIT Jameel Clinic для машинного обучения в сфере здравоохранения, — это первая модель с полностью открытым исходным кодом. Она обеспечивает высочайшую производительность на уровне AlphaFold3 — модели от Google DeepMind, которая предсказывает трехмерные структуры белков и других биологических молекул. Белки играют важнейшую роль практически во всех биологических процессах. Форма белка тесно связана с его функцией, поэтому понимание структуры белка имеет решающее значение для разработки новых лекарств или создания новых белков с определенными функциями.
В своей работе над Boltz-1 исследователи Массачусетского технологического института использовали тот же подход, что и в AlphaFold3, но после изучения базовой модели диффузии они изучили потенциальные улучшения. Они внедрили те из них, которые больше всего повысили точность модели, например, новые алгоритмы, повышающие эффективность прогнозирования.
Наряду с самой моделью они сделали общедоступным весь свой конвейер для обучения и тонкой настройки, чтобы другие ученые могли использовать Boltz-1.
Исследователи планируют продолжать улучшать производительность Boltz-1 и сокращать время, необходимое для составления прогнозов.