Böyük həcmli verilənlərin klasterləşdirilməsi üçün effektiv alqoritm işlənilib

01.01.1970 04:00

A-
A
A+

Böyük həcmli verilənlərin klasterləşdirilməsi üçün effektiv alqoritm işlənilib

AMEA-nın İnformasiya Texnologiyaları İnstitutu əməkdaşlarının həmmüəllifliyi ilə çap edilmiş “Böyük həcmli verilənlərin klasterləşdirilməsi üçün paralel paketli k-means alqoritmi” (“Parallel batch k-means for Big data clustering”) adlı məqalə nüfuzlu “Computers & Industrial Engineering” jurnalında dərc olunub. “Web of Science” bazasında indeksləşən bu jurnal Q1 sinfinə daxildir və İmpakt Faktoru 4.135-ə bərabərdir.

Məqalənin müəllifləri AMEA-nın vitse-prezidenti, İnformasiya Texnologiyaları İnstitutunun direktoru, akademik Rasim Əliquliyev, şöbə müdiri, AMEA-nın müxbir üzvü Ramiz Alıquliyev və aparıcı elmi işçi, dosent Lyudmila Suxostatdır.t

SOCAR-ın qrant layihəsi çərçivəsində hazırlanmış məqalədə böyük həcmli verilənlərin analizi üçün paralel paketli k-means alqoritmi işlənilmişdir. Təklif olunan alqoritm kompüterlərin yaddaş və hesablama resursları çərçivəsində böyük həcmli verilənləri analiz etmək imkanına malikdir. Bu alqoritm kompüterin yaddaş və hesablama resurslarını nəzərə alaraq ilkin böyük həcmli verilənləri paketlərə bölür, sonra paketləri k-means alqoritminin köməyilə paralel olaraq klasterləşdirir. Paralel emaldan sonra alınan nəticələr (başqa sözlə paketləri klasterləşdikdən sonra tapılan klaster mərkəzləri) birlikdə yenidən klasterləşdirilir. Son mərhələdə alınmış klaster mərkəzləri bütün verilənlər dəstinin klaster mərkəzləri kimi qəbul edilir və daha sonra ilkin verilənlər bu mərkəzlərə nəzərən qruplaşdırılır. Bir neçə real verilənlər dəsti üzərində aparılmış eksperimentlər göstərmişdir ki, təklif olunan alqorirtm k-means alqoritminə nəzərən dəfələrlə (bəzi hallarda isə 10 dəfələrlə) sürətli işləyir. Məqsəd funksiyasının qiymətinə görə isə o, bəzi hallarda k-means alqoritminə bir neçə faiz uduzur. Analiz göstərmişdir ki, bu çatışmazlığı aradan qaldırmaq imkanları var və o, gələcək tədqiqatlarda araşdırılacaqdır. Nəticələrin statistik analizi isə göstərmişdir ki, təklif olunan alqoritm kifayət qədər stabil işləyir, hətta əksər hallarda k-means alqoritmindən daha yaxşı nəticə nümayiş etdirir.