Морской «рентген»: датасет Китая помогает находить корабли в темноте и при помехах

Волны, блики и расстояние мешают алгоритмам. Китайские ученые предложили объединить два типа изображений.
Автор Hi-Tech Mail
Китай представил датасет для распознавания кораблей ночью и в помехах
Китай представил датасет для распознавания кораблей ночью и в помехахИсточник: Journal of Radars

Китайские военные исследователи опубликовали крупнейший в мире открытый набор данных для распознавания кораблей. В нем больше 2 тыс. парных снимков судов в видимом и инфракрасном диапазоне и почти 20 тыс. размеченных объектов. С такой базой данных можно обучать системы наведения дронов, ракет и разведывательных аппаратов особенно в условиях ночи или когда радар заглушен помехами.

Работу провели совместно специалисты Военно-морского авиационного университета в Яньтае, Харбинского инженерного университета и Института вычислительных технологий Китайской академии наук. Результаты опубликовали в рецензируемом журнале Journal of Radars.

Опознать судно в открытом море куда сложнее, чем любой объект на суше. Блики на воде, переменная погода, большие дистанции съемки и загроможденный фон сбивают алгоритмы. Поэтому современные системы наведения давно работают через два канала, обычную оптику плюс тепловизор. Инфракрасный снимок фиксирует тепловой след двигателей и корпуса там, где видимый диапазон отражает лишь серое пятно на серой воде.

Главная особенность датасета — парный формат данных
Главная особенность датасета — парный формат данныхИсточник: Sensors

До сих пор открытых коллекций с парными кадрами обоих типов практически не существовало. Команды либо собирали закрытые корпуса, либо работали с синтетикой, что заметно снижало точность итоговых моделей. Новый массив охватывает разное состояние моря и освещенности, эти данные уже пригодны для тренировки алгоритмов под реальные сценарии. Парный формат при этом важен. Нейросеть одновременно учится сопоставлять визуальный облик цели с ее тепловой сигнатурой, поэтому замечать стратегически значимые объекты система учится, не взирая на маскировку и атмосферные помехи. Разметка почти 20 тыс. экземпляров вручную — огромный труд, который обычно остается за закрытыми дверями военных лабораторий.

До сих пор подобные наборы данных были скрыты или создавались искусственно
До сих пор подобные наборы данных были скрыты или создавались искусственноИсточник: Recraft

Практическую остроту темы подчеркнул февральский эпизод у Ормузского пролива. Иран заявил об ударе по американскому авианосцу «Авраам Линкольн», Вашингтон это опроверг. Здесь очертилась главная проблема: выйти в район нахождения корабля задача вполне решаемая, а вот опознать и сопровождать движущуюся морскую цель в сложных условиях — совсем другое дело.

Открытая публикация выглядит как намеренный шаг. Китай последовательно наращивает присутствие в Южно-Китайском море и вкладывает большие деньги в беспилотные ударные системы морского базирования. Доступный корпус данных позволит сторонним командам быстрее улучшать алгоритмы обнаружения, а лучшие решения со временем осядут в военных разработках. Так фундаментальная наука и оборонные интересы снова оказываются по одну сторону.

Ранее мы писали о том, что первый в мире водородный круизный лайнер Viking Libra спущен на воду.