DEVELOPMENT OF  THE ALGORITHM OF  KEYWORD SEARCH  IN THE KAZAKH  LANGUAGE TEXT  CORPUS

Akanova, А.; Ospanova, N.; Kukharenko, Y.; Abildinova, G.

dc.contributor.author	Akanova, А.
dc.contributor.author	Ospanova, N.
dc.contributor.author	Kukharenko, Y.
dc.contributor.author	Abildinova, G.
dc.date.accessioned	2024-12-10T06:14:20Z
dc.date.available	2024-12-10T06:14:20Z
dc.date.issued	2019
dc.identifier.issn	1729-3774
dc.identifier.other	DOI: 10.15587/1729-4061.2019.179036
dc.identifier.uri	http://rep.enu.kz/handle/enu/20000
dc.description.abstract	ве мiсце в комп'ютернiй лiнгвiстицi. Дослiдники даної областi мають пiдвищений iнтерес до розробки алгоритму, використання якого дозволить пiдвищити якiсть обробки корпусу тексту та ймовiрнiсне визначення змiсту тексту. Результати дослiдження застосувань методик, пiдходiв, алгоритмiв для семантичного аналiзу тексту у комп'ютернiй лiнгвiстицi в мiжнароднiй i казахстанськiй науцi призвели до розробки алгоритму пошуку ключових слiв в текстi казахською мовою. Першим етапом алгоритму було складання еталонного словника ключових слiв для корпусу тексту українською мовою. Вирiшенням цiєї проблеми стало застосування алгоритму Портера (стеммера) для корпусу текстiв казахською мовою. Реалiзацiя стеммера дозволила видiлити унiкальнi основи слiв i отримати еталонний словник, який згодом проiндексували. Наступний крок – це збiр навчальних даних iз корпусу текстiв. Для обчислення ступеня семантичної близькостi мiж словами кожному слову присвоюється вектор вiдповiдних йому словоформ еталонного словника, в результатi якого виходить пара – ключове слово i вектор. I останнiм кроком алгоритму є навчання нейронних мереж. При навчаннi застосовується метод зворотного поширення помилок, що дозволяє провести семантичний аналiз корпусу тексту i отримати ймовiрнiсну кiлькiсть слiв, близьку до очiкуваної кiлькостi ключових. Цей процес дозволяє автоматизувати обробку текстового матерiалу шляхом створення цифрових навчальних моделей ключових слiв. Алгоритм використовується для розробки нейрокомп'ютерної системи, що буде проводити автоматичну перевiрку текстових робiт учнiв онлайн курсiв. Унiкальнiстю алгоритму пошуку ключових слiв є застосування навчання нейронної мережi для текстiв казахською мовою. У Казахстанi вченими в областi комп'ютерної лiнгвiстики було проведено ряд дослiджень на основi застосування морфологiчного аналiзу, лемматизацiї та iнших пiдходiв i реалiзованi лiнгвiстичнi iнструменти (в основному словники-перекладачi). Область застосування навчання нейронних мереж для синтаксичного аналiзу казахської мови залишається вiдкритим питанням в казахстанськiй науцi. Розроблений алгоритм передбачає вирiшення однiєї з проблем в отриманнi ефективного семантичного аналiзу тексту казахською мовою	ru
dc.language.iso	en	ru
dc.publisher	Eastern-European Journal of Enterprise Technologies	ru
dc.relation.ispartofseries	5/2 ( 101 );
dc.subject	ключове слово	ru
dc.subject	алгоритм Портера	ru
dc.subject	семантичний аналiз	ru
dc.subject	нейронна мережа	ru
dc.title	DEVELOPMENT OF THE ALGORITHM OF KEYWORD SEARCH IN THE KAZAKH LANGUAGE TEXT CORPUS	ru
dc.type	Article	ru

Files in this item

Name:: Development-of-the-algorithm-o ...
Size:: 370.4Kb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Engineering[651]

Show simple item record