Новый класс нейросетей впервые применили для обработки снимков с камеры

Ученым удалось ликвидировать разрыв между классическими и нейросетевыми алгоритмами обработки цвета, создав универсальный нейросетевый подход cmKAN. Он позволяет более точно сравнивать и корректировать в автоматическом режиме цвета изображения.
Автор Hi-Tech Mail
Сети Колмогорова-Арнольда (KAN) — это новый класс нейронных сетей, который позволил нейросетевым методам обойти классические по качеству обработки цвета.
Сети Колмогорова-Арнольда (KAN) — это новый класс нейронных сетей, который позволил нейросетевым методам обойти классические по качеству обработки цвета.Источник: наука.рф

Команда ученых из России, Германии и Канады представила новую технологию повышения точности воспроизведения цветов цифровыми камерами cmKAN. Разработанную методику успешно испытали на разных видах задач, касающихся обработки цветных снимков. Итоги тестов демонстрируют значительное превосходство технологии над ныне используемыми методами коррекции цветопередачи, предлагаемыми производителями мобильных телефонов и фотокамер по всему миру, говорится на сайте Десятилетия науки и технологий в России.

«Разные камеры по-разному отображают цвет, при переходе между камерами цвета на снимках существенно различаются, более того, эти различия камер носят нелинейный характер, что затрудняет и восприятие, и автоматическую обработку изображений. Несмотря на впечатляющие успехи нейросетевых методов практически во всех сферах компьютерного зрения, точная обработка цвета до настоящего времени оставалась вотчиной классических алгоритмов», — комментирует профессор Артем Никоноров, директор Института искусственного интеллекта и руководитель Центра «Интеллектуальная мобильность многофункциональных беспилотных авиационных систем» Самарского университета им. Королева.

Как пояснил эксперт, функционирование нейросети нового класса похоже на работу профессионала, который настраивает цвета на фотографиях в программах вроде Photoshop или Lightroom. Оператор меняет оттенок неба, стен здания и фонарей по отдельности, поскольку каждый участок требует своего подхода. Нейросеть тоже разделяет картинку на разные зоны и обрабатывает каждую зону индивидуально, учитывая особенности освещения и деталей.

Сети KAN представляют собой новый тип архитектуры нейронных сетей, созданный на основе теоремы советских ученых Андрея Колмогорова и Владимира Арнольда. Эта архитектура появилась в 2024 году и способна заменить привычные многослойные персептроны (MLP), которые сейчас широко применяют в системах распознавания изображений и языковых моделях.
Сети KAN представляют собой новый тип архитектуры нейронных сетей, созданный на основе теоремы советских ученых Андрея Колмогорова и Владимира Арнольда. Эта архитектура появилась в 2024 году и способна заменить привычные многослойные персептроны (MLP), которые сейчас широко применяют в системах распознавания изображений и языковых моделях.Источник: Freepik

Чтобы обучить и проверить эффективность технологии cmKAN, специалисты сформировали и выложили в открытый доступ обширный датасет Volga2K. Он состоит из более чем двух тысяч пар фотографий, сделанных разными камерами в различных условиях и локациях. Известно, что технология уже прошла тестирование на ключевых задачах, связанных с обработкой цветных изображений. Экспериментальные результаты демонстрируют превосходство нового метода над существующими аналогами в среднем на 37,3%.

Помимо прочего, cmKAN прекрасно справляется с обработкой сцен, характеризующихся высоким динамическим диапазоном, и изображений, сделанных в сложных условиях освещения. Предлагаемый подход перспективен не только для интеграции в камеры смартфонов, но и для внедрения в разработку новых процессоров обработки изображений для цифровых фотокамер. Он также подходит для автоматического редактирования и цветокоррекции снимков в таких отраслях, как издательство, полиграфия, подготовка медиаконтента и профессиональная визуализация.

Тем временем австралийская полиция создала нейросеть для перевода эмодзи, используемых преступниками.