Abstract
<jats:p>Розроблено смарт-систему семантичного пошуку текстових даних, що застосовує сучасні методи векторного подання тексту та орієнтована на роботу з великими масивами неструктурованої інформації. У роботі реалізовано комплексний підхід, який поєднує глибоку векторизацію тексту, побудову високопродуктивного індексу та оркестрацію пошукових запитів за допомогою технологій LangChain, LangGraph, PostgreSQL та Pinecone. Проведено повний цикл дослідження: підготовку набору даних, очищення та нормалізацію текстових документів, автоматизований поділ на чанки відповідного розміру для підвищення якості ембедингів, побудова векторного індексу та виконання пошуку за різними типами запитів користувача. Окрему увагу приділено вимірюванню продуктивності великої мовної моделі, зокрема – тривалості відповіді, стабільності за навантаження та точності рекомендацій із використанням метрик Recall@k, MRR і nDCG. Інтегровано підсистеми кешування (Redis) і спостереження (LangSmith), що забезпечують додаткову стійкість до пікових навантажень та полегшують аналіз роботи моделей. Отримані результати демонструють істотне зменшення середньої тривалості пошуку (до 120 мс) і приріст релевантності приблизно на 15 % порівняно з класичними алгоритмами на кшталт BM25. Запропоновано гібридну модель, що комбінує семантичний векторний пошук текстових даних із процедурою їхнього ранжування, завдяки чому підвищується точність пошуку у доменах із високою варіативністю формулювань. Практична цінність роботи полягає у можливості інтеграції системи в корпоративні бази знань, у служби підтримки прийняття рішень, в освітні платформи та бібліотечні інформаційні системи. Запропоновані підходи сприяють подальшому розвитку інструментів семантичного пошуку та відкривають перспективи вдосконалення методів векторизації тексту, оптимізації індексації та розширення застосувань у RAG-архітектурах і мультиагентних системах.</jats:p>