Back to Search View Original Cite This Article

Abstract

<jats:p>В статье представлен подход к построению цифрового портрета социально-экономического развития региона на основе автоматизированного анализа текстовых данных. В качестве ключевого индикатора рассматриваются описания грантовых проектов, поддержанных в Республике Марий Эл за 2023–2025 годы. С помощью комбинации методов тематического моделирования – классического LDA и современного нейросетевого BERTopic – выявлены и визуализированы латентные тематические паттерны, формирующие актуальную повестку развития территории. Полученный «портрет» позволяет объективно оценить структуру гражданских инициатив, выявить доминирующие направления (социальная поддержка, развитие человеческого капитала, спорт, образование) и определить их соответствие стратегическим целям региона. В результате исследования установлено, что смыслообразующим ядром грантовой повестки выступает целевая группа «дети», вокруг которой концентрируются кластеры образовательных, реабилитационных и инклюзивных проектов. LDA-моделирование выделило пять устойчивых тематических направлений, в том числе поддержку семей с детьми и адаптацию лиц с ограниченными возможностями здоровья. BERTopic, в свою очередь, позволил детализировать узкие нишевые практики, например, инклюзивный спорт, реабилитацию людей с нарушениями зрения и культурно-досуговые программы для детей с ОВЗ (ограниченными возможностями здоровья), что подтверждает высокую семантическую чувствительность нейросетевого подхода. Сопоставление полученных тематических кластеров с проектом Стратегии социально-экономического развития Республики Марий Эл выявило как зоны полного совпадения приоритетов (поддержка детства, инклюзия), так и стратегические дисбалансы: слабую представленность проектов в сферах креативных индустрий, туризма и работы с молодёжью. Предложенная методика демонстрирует, что методы машинного обучения открывают новые возможности для мониторинга и диагностики состояния региональных и муниципальных систем, обеспечивая управленческие команды Data-Driven-инструментом для принятия решений и коррекции грантовой политики. Таким образом, тематическое моделирование позволяет перевести массив неструктурированных текстовых данных в плоскость объективного анализа, превращая описание гражданских инициатив в надежный инструмент выявления реальных социальных приоритетов и основу для стратегического планирования.</jats:p> <jats:p>This article proposes an approach for creating a digital profile of a region’s socio-economic development through automated text data analysis. Grant project descriptions from the Republic of Mari El (2023–2025) were used as a key indicator. By combining classical LDA with the modern neural BERTopic model, latent thematic patterns shaping the region’s current development agenda were identified and visualized. The resulting digital profile allows for an objective evaluation of civic initiatives, highlights dominant areas such as social support, human capital development, sports, and education, and assesses their alignment with regional strategic goals. The study found that the target group "children" forms the core of the grant agenda, centering on clusters of educational, rehabilitation, and inclusive projects. LDA modeling identified five consistent thematic areas, including support for families with children and the adaptation of individuals with disabilities. BERTopic, in turn, enabled the detailed elaboration of narrow niche practices, such as inclusive sports, rehabilitation for people with visual impairments, and cultural and leisure programs for children with disabilities, confirming the high semantic sensitivity of the neural network approach. Comparison of the resulting thematic clusters with the draft Strategy for Socioeconomic Development of the Republic of Mari El revealed both areas of complete priority overlap (childhood support, inclusion) and strategic imbalances: the underrepresentation of projects in the creative industries, tourism, and youth work. The proposed methodology demonstrates that machine learning methods open up new opportunities for monitoring and diagnosing the state of regional and municipal systems, providing management teams with a data-driven tool for decision-making and adjusting grant policy. Thus, thematic modeling enables the translation of unstructured text data into an objective analysis, transforming descriptions of civic initiatives into a reliable tool for identifying real social priorities and the basis for strategic planning.</jats:p>

Show More

Keywords

bertopic для development thematic развития

Related Articles