Texnologiyanın inkişaf etdiyi və məlumatların sürətlə artdığı bir dövrdə “Data Science”-ə tələbat getdikcə artır. Edilən son araşdırmalara görə dünyadakı məlumatların 90%-i son 2 ildə yaranıb. Məlumatlara artan tələbə misal olaraq Facebook-u deyə bilərik. Hər saatda Facebook-a 10 milyon şəkil yüklənir. Onlayn alış-veriş və ya bank əməliyyatları gündən-günə artdığından tranzaksiyalardan  böyük həcmli məlumatlar əldə edilir. Günü gündən artan bu məlumatları bizə faydalı olacaq şəkildə necə istifadə edə bilərik?

Data-lardan istifadə edib keçmiş, bu gün və gələcək haqqında məlumat əldə edə bilərik. Məlumatın  vaxtı vacib olduğu kimi onun faydalı olub olmamasıda bir o qədər vacibdir. “Data Science” məlumatların toplanması, analiz olunaraq nəticələr əldə edilməsi və bu nəticələr əsasında yeni qərarların verilməsi ilə məşğul olan tədqiqat sahəsidir. Təşkilatlarda suallara cavab vermək və strategiyanı idarə etmək üçün istifadə olunan böyük həcmli məlumatları təşkil etmək və analiz etmək üçün kompleks alqoritmləri qurmağı bacaran, yüksək səviyyəli texniki bacarıqlara sahib insanlar   “Data Scientist” -lərdir.

“Data Science”  - in üç əsas komponenti var:

1.Statistika - “Data Science”-in əsasını təşkil edir. Onun köməyi ilə məlumatlardan daha dəqiq və faydalı nəticə almaq olur.

2.Kompüter bilikləri - Hər hansısa “Data Science” layihəsini başa vurmaq üçün proqramlaşdırma bilikləri mütləqdir. Ən çox yayılmış Python və R proqlamlaşdırma dilləridir. R statistik analiz aparmaq üçün ən zəngin sistemlərdən biridir. Təxmini 12000-ə qədər kitabxanası mövcuddur. Python ümümi təyinatlı bir dil olduğu üçün “Machine Learning”, ”Artificial Intelligence”,  ”Deep Learning”,  ”Web Development” və s kimi bir çox sahələrdə istifadə olunur. “Data Science” üçün istifadə olunan beş əsas Python kitabxanası bunlardır: Numpy, Pandas, Scipy, Scikit-learn and Seaborn.

3.Sahə biliyi - İşin biznes tərəfini başa düşmək  “Data Science” layihələrində ən önəmli məsələlərdəndir. Çalışdığınız sahə ilə bağlı kifayət qədər  biliyiniz yoxdursa,məlumatlara aldanıb səhv qərarlar vermək riskiniz var.

“Data Science” layihəsini düzgün həll etmək və  təqdim etmək üçün atılan addımlar  “Data Science Life Cycle”  adlanır və 5 əsas mərhələdən ibarətdir.

 

  1. Məsələnin qoyuluşu - Layihələrdə tez-tez edilən səhvlərdən biri də məsələni anlamadan məlumatların toplanması və analizidir. Buna görə də layihəyə başlamadan əvvəl məsələni anlamaq çox vacibdir. Məsələni başa düşüb müxtəlif spesifikasiyaları, tələbləri, prioritetləri və tələb olunan büdcəni müəyyən etmək lazımdır.
  2. Məlumatların hazırlanması - Məlumatı təmizləmək, araşdırmaq bu mərhələdə aparılır. Bunun üçün R və ya Python proqlamlaşdırma dillərindən istifadə edə bilərsiz.
  3. Modelləşdirmə - Bu mərhələdə məsələyə uyğun düzgün model seçilir və qurulur. Asılı dəyişənin qiymətindən (“categorical” və ya “numeric” ) olmasından asılı olaraq “classification”  və “regression”  modeli seçilir.
  4. Layihənin doğrulanması - Layihənin bu mərhələsində qurulan model test edilir və səhvlər aradan qaldırılır.
  5. Tətbiqetmə - “Data Science” layihəsində ən son mərhələlərdən biridir. Tətbiq etmə, “Machine Learning” modelini mövcud bir istehsal mühitinə inteqrasiya edən bir mərhələdir.

 

Bütün bizneslərin effektivliyini və produktivliyini artırmaq üçün “Data Science” mütləqdir. Belə bir vəziyyətdə “Data Science” həmişə inkişaf edəcəkdir, buna görə də ən son trendləri izləməyi unutmayın.