Abstract
<jats:p>Бұл мақалада криминалистика саласында мәтіндік деректерді интеллектуалды талдау мен автоматты сараптау үшін жасанды интеллект пен терең нейрондық желілерді қолдану мәселесі қарастырылды. Қазіргі таңда интернеттегі ақпараттың шамадан тыс көбеюі және әлеуметтік желілерде пайда болатын деректердің жылдам таралуы құқық қорғау органдары үшін үлкен талдау міндетін тудырып отыр. Тергеу мен сот сараптамаларында цифрлық дәлелдер құрамында мәтіндік материалдар көп кездеседі, сондықтан оларды автоматты өңдеу мен криминалистикалық тұрғыда бағалау өзекті бағыттардың бірі болып саналады. Зерттеу жұмысының мақсаты – мәтіндік деректерден құқық бұзушылық белгілерін, агрессивті немесе экстремистік сипаттағы мазмұндарды анықтай алатын терең нейрондық желі моделін құру. Мақалада LSTM және Attention архитектураларының негізінде құрылған модель ұсынылады. Бұл тәсіл қазақ тіліндегі мәтіндердің семантикалық құрылымын, контекстік байланыстарын және эмоционалды реңкін тиімді талдауға мүмкіндік береді. Деректерді өңдеу кезеңінде мәтіндер токенизацияланып, артық белгілерден тазартылады, сондай-ақ TF-IDF және Word2Vec әдістері арқылы векторлық түрлендіру жүргізілді.. Мұндай көрсеткіш классикалық әдістерден (логистикалық регрессия, SVM) жоғары екенін көрсетті. Ұсынылған әдістеме криминалистикалық сараптама барысында дәлелдік материалдарды жедел және дәл өңдеуге мүмкіндік береді. Бұл қылмыстық істерді тергеу процесін автоматтандыруға, сот сарапшыларының жұмысын жеңілдетуге және адам факторына тәуелділікті азайтуға бағытталған маңызды қадам болып табылады. Мақала нәтижелері болашақта интеллектуалды сараптау жүйелерін дамытуға, қазақ тіліндегі криминалистикалық деректер қорын кеңейтуге және құқық қорғау саласындағы жасанды интеллект қолданбаларын жетілдіруге негіз бола алады.</jats:p>