
Новое исследование ученых из Университета Нотр-Дам наглядно показало, как мультимодальные языковые модели — тип ИИ, способный анализировать различные типы данных и логически рассуждать — могут повлиять на будущее рабочих профессий. Вопреки распространенному мнению о том, что ИИ применяется преимущественно в офисной среде, исследование сфокусировалось на производственной сфере, где выгоды от внедрения ИИ на первый взгляд могут показаться не столь очевидными.
Особое внимание было уделено сварке — одной из ключевых технологических операций в множестве отраслей, в том числе, в производстве автомобилей, морской техники, авиации и сельскохозяйственной продукции. Исследователи оценивали, насколько точно искусственный интеллект может анализировать качество сварочных швов по изображениям и определять их пригодность для конкретных изделий. Оказалось, что мультимодальные языковые модели достаточно эффективно анализируют изображения из интернета, однако при работе с реальными фотографиями, сделанными в промышленных условиях, их эффективность значительно снижалась. По мнению авторов, это говорит о необходимости адаптации ИИ к реальному производству через обучение на данных с «полевых» источников и разработку более тонких методов извлечения знаний.
В рамках исследования ученые сотрудничали с профессионалами и учебными заведениями северной Индианы, региона с одной из самых высоких концентраций производственных рабочих мест в США. Эта работа стала возможной благодаря инициативе iNDustry Labs — междисциплинарной платформе Университета Нотр-Дам, нацеленной на развитие местной промышленности. Благодаря поддержке более 80 предприятий региона были собраны уникальные изображения сварных швов, на основе которых и строился анализ.

По словам профессора Нитеша Чавлы, одного из авторов исследования и директора Института данных и общества семьи Люси, ключевой задачей остается повышение точности и надежности ИИ в условиях, отличных от лабораторных. Он подчеркивает, что для обеспечения безопасности рабочих и повышения качества продукции критически важны правильная настройка моделей и их обучение на реальных производственных примерах. При этом крупные универсальные модели не всегда показывают лучшие результаты — иногда более простые, но точно настроенные нейросети оказываются гораздо эффективнее.
Авторы исследования подчеркивают, что в будущем специалистам в сфере машинного обучения придется сосредоточиться на разработке моделей, способных адекватно работать в непривычных для них условиях, а также на внедрении объяснимого ИИ, который сможет обеспечить прозрачность и подотчетность в принятии решений. Это особенно важно в промышленности, где ошибки могут иметь дорогостоящие или даже опасные для здоровья работников последствия. В конечном итоге, развитие таких технологий поможет не только сделать производственные процессы более безопасными и качественными, но и расширить экономические возможности для рабочих и промышленности в целом.
Тем временем ИИ завоевывает все новые и новые сферы: так, в Китае открылась первая в мире больница с виртуальными врачами и искусственным интеллектом.