Back to Search View Original Cite This Article

Abstract

<jats:p>В статье представлена многозадачная нейронная сеть на основе модифицированной архитектуры U-Net для совместной семантической и инстанс-сегментации объектов на аэрофотоснимках. Модель использует симметричный энкодер-декодер с skip-коннекторами и оснащена двумя параллельными выходными головами. Семантическая голова выполняет пиксельную классификацию, а эмбеддинговая генерирует дискриминативные векторные представления для каждого пикселя. Применение специализированной дискриминативной функции потерь обеспечивает компактность кластеров эмбеддингов внутри объектов и их разделение между разными экземплярами. На этапе постобработки кластеризация эмбеддингового поля позволяет однозначно выделить маски отдельных объектов.</jats:p> <jats:p>Эксперименты проводились на специализированном датасете аэрофотоснимков, содержащем 23 076 размеченных объектов пяти классов. Для ключевого класса «Building» на валидационной выборке достигнуты значения IoU = 0.812 и F1-score = 0.880. Сравнение с современными методами (Mask2Former, OneFormer, SAM 2 с LoRA-адаптацией, MR-DeepLabv3</jats:p> <jats:p> <mml:math xmlns:mml="http://www.w3.org/1998/Math/MathML"> <mml:msup> <mml:mi/> <mml:mo>+</mml:mo> </mml:msup> </mml:math> </jats:p> <jats:p>) подтверждает конкурентоспособность модели по балансу точности и скорости инференса.</jats:p> <jats:p>Модель демонстрирует эффективность для задач автоматического картографирования и анализа застройки по данным дистанционного зондирования.</jats:p>

Show More

Keywords

на объектов для Модель по

Related Articles