Abstract
<jats:p>Предложен вычислительный метод семантической сегментации изображений с оценкой распределительной неопределенности на основе представления предсказания в виде поля распределений Дирихле. В отличие от подходов, требующих многократных стохастических прогонов при инференсе (MC-dropout) или усреднения по ансамблю независимых моделей, метод вычисляет карты неопределенности в замкнутой форме по параметрам поля Дирихле, предсказанным за один прямой проход нейросети. Метод формулируется как минимизация составного функционала, включающего ожидаемую логарифмическую функцию потерь (expected log-loss), KL-регуляризацию для управления концентрацией распределения и пространственное сглаживание, учитывающее локальные перепады интенсивности изображения (edge-aware). Для фиксированных гладких полей установлена асимптотическая точность дискретизации используемых пространственных регуляризаторов: дискретная энергия Дирихле аппроксимирует соответствующий непрерывный интеграл с погрешностью первого порядка по шагу сетки. Дополнительно введено формальное разложение общей неопределенности на эпистемическую и подтвержденную данными компоненты, которое может использоваться в дальнейшем при анализе поведения метода и построении расширений. Вычислительные эксперименты выполнены на трех наборах медицинских изображений (ACDC, Synapse, CHAOS) с 10 независимыми инициализациями. В основном сравнении с базовой моделью, обученной по кросс-энтропии, различия статистически значимы по инициализациям на всех датасетах; на ACDC дополнительно подтверждена значимость на уровне пациентов. Метод повышает качество сегментации и улучшает калибровку вероятностных оценок при накладных расходах порядка 17 %. В задаче детекции ошибок сегментации на уровне пикселей карта неопределенности достигает AUROC 0,891.</jats:p> <jats:p>A computational method for semantic image segmentation with distributional uncertainty estimation is proposed based on representing the prediction as a Dirichlet distribution field. Unlike approaches that require multiple stochastic inference runs (MC dropout) or averaging over an ensemble of independent models, the method computes uncertainty maps in closed form based on the Dirichlet field parameters predicted in a single forward pass of the neural network. The method is formulated as the minimization of a composite functional including the expected logarithmic loss function (expected log-loss), KL regularization for controlling the distribution concentration, and spatial smoothing that takes into account local image intensity variations (edge-aware). For fixed smooth fields, the asymptotic discretization accuracy of the spatial regularizers used is established: the discrete Dirichlet energy approximates the corresponding continuous integral with a first-order error over the grid step. Additionally, a formal decomposition of the overall uncertainty into epistemic and data-supported components was introduced, which can be used in further analysis of the method's behavior and the development of extensions. Computational experiments were performed on three medical image datasets (ACDC, Synapse, CHAOS) with 10 independent initializations. In the main comparison with the baseline model trained using cross-entropy, the differences are statistically significant across initializations on all datasets; for ACDC, significance at the patient level was further confirmed. The method improves segmentation quality and improves the calibration of probability estimates with an overhead of approximately 17 %. In the task of detecting pixel-level segmentation errors, the uncertainty map achieves an AUROC of 0.891.</jats:p>