Інформаційна технологія квантитативного аналізу україномовного текстового контенту на основі DocBin-структур, Information Technology for Quantitative Analysis of Ukrainian-Language Textual Content Based on DocBin Structures

Authors: Іван Володимирович Козак, Вікторія Анатоліївна Висоцька, Любомир Вікторович Чирун

Publication: Central Ukrainian Scientific Bulletin Technical Sciences

Published: Mar 27, 2026

Source: Crossref

Back to Search View Original Cite This Article

Abstract

<jats:p>У роботі представлено інформаційну технологію на основі розробки програмної підсистеми квантитативного аналізу українських текстів як компонента інформаційної системи обробки корпусних даних. Реалізовано алгоритми обчислення лексичних і морфологічних індексів (TTR, індекс Гоноре, індекс номінативності, частоти лем і POS) на основі структур DocBin із використанням spaCy та pandas. Проведено експериментальне тестування на корпусі з 7 документів обсягом близько 18 000 токенів. Час опрацювання 1 тис. токенів становив 0,11–6,72 с залежно від обраного NLP-агента. Результати підтвердили лінійну масштабованість, стабільність обчислень та можливість інтеграції підсистеми в захищені програмні середовища для аналітики текстових даних, зокрема в задачах моніторингу інформаційного простору та виявлення аномалій.</jats:p>

Keywords

на та основі підсистеми даних

Abstract

Keywords

Related Articles

СУПЕРВІЗІЯ ЯК ПЕДАГОГІЧНА ТЕХНОЛОГІЯ У СИСТЕМІ ПРОФЕСІЙНОЇ ОСВІТИ СОЦІАЛЬНИХ ПРАЦІВНИКІВ, AS A PEDAGOGICAL TECHNOLOGY IN THE SYSTEM OF PROFESSIONAL EDUCATION OF SOCIAL WORKERS

FLIPPED CLASSROOM ЯК СУЧАСНА ПЕДАГОГІЧНА ТЕХНОЛОГІЯ ПРОФЕСІЙНОЇ ПІДГОТОВКИ У ВИЩІЙ ШКОЛІ