Смарт-система семантичного пошуку текстових даних

Authors: П. А. Кок, А. Є. Батюк

Publication: Scientific Bulletin of UNFU

Published: Dec 22, 2025

Source: Crossref

Back to Search View Original Cite This Article

Abstract

<jats:p>Розроблено смарт-систему семантичного пошуку текстових даних, що застосовує сучасні методи векторного подання тексту та орієнтована на роботу з великими масивами неструктурованої інформації. У роботі реалізовано комплексний підхід, який поєднує глибоку векторизацію тексту, побудову високопродуктивного індексу та оркестрацію пошукових запитів за допомогою технологій LangChain, LangGraph, PostgreSQL та Pinecone. Проведено повний цикл дослідження: підготовку набору даних, очищення та нормалізацію текстових документів, автоматизований поділ на чанки відповідного розміру для підвищення якості ембедингів, побудова векторного індексу та виконання пошуку за різними типами запитів користувача. Окрему увагу приділено вимірюванню продуктивності великої мовної моделі, зокрема – тривалості відповіді, стабільності за навантаження та точності рекомендацій із використанням метрик Recall@k, MRR і nDCG. Інтегровано підсистеми кешування (Redis) і спостереження (LangSmith), що забезпечують додаткову стійкість до пікових навантажень та полегшують аналіз роботи моделей. Отримані результати демонструють істотне зменшення середньої тривалості пошуку (до 120 мс) і приріст релевантності приблизно на 15 % порівняно з класичними алгоритмами на кшталт BM25. Запропоновано гібридну модель, що комбінує семантичний векторний пошук текстових даних із процедурою їхнього ранжування, завдяки чому підвищується точність пошуку у доменах із високою варіативністю формулювань. Практична цінність роботи полягає у можливості інтеграції системи в корпоративні бази знань, у служби підтримки прийняття рішень, в освітні платформи та бібліотечні інформаційні системи. Запропоновані підходи сприяють подальшому розвитку інструментів семантичного пошуку та відкривають перспективи вдосконалення методів векторизації тексту, оптимізації індексації та розширення застосувань у RAG-архітектурах і мультиагентних системах.</jats:p>

Keywords

та пошуку на текстових даних

Смарт-система семантичного пошуку текстових даних

Abstract

Keywords

Related Articles

Система информирования студентов об их образовательной активности и её влияние на посещаемость

МИТНА СИСТЕМА УКРАЇНИ В ПРОЦЕСІ ЄВРОІНТЕГРАЦІЇ: АДАПТАЦІЯ ДО НОРМ ТА ПРАКТИК ЄВРОПЕЙСЬКОГО СОЮЗУ

ІНТЕЛЕКТУАЛЬНА СИСТЕМА ДЛЯ ВИЗНАЧЕННЯ ШКІДНИКІВ РОСЛИН НА ОСНОВІ НЕЙРОМЕРЕЖЕВИХ ТЕХНОЛОГІЙ, Intelligent system for determining plant pests based on neural network technologies

A system of shared values between the cooperative model and the sustainable development goals, Споделена ценностна система между кооперативния модел и целите за устойчиво развитие