DATA SCİENCE NEDİR?

Data science en kısa ifadeyle veri bilimi demektir. Peki nedir bu veri bilimi anlamına gelen data science ?

İnsanlık tarihinin elde ettiği bütün verilerin incelenmesi uzman beyinler aracılığıyla bu bilgilerin anlamdırılması, bilgiler

arasındaki bağıntıyı anlayıp bu bilgilerin vermeye çalıştığı yeni bilgilerin keşfedilmesi olarak tanımlamak istiyorum. Data

science denilince akla gelen ilk veriler hep bilgisayar ve internet üzerindeki bilgiler olsa da data science bütün elde edilen

bilgileri kapsar. Peki data science bu bilgileri nasıl elde eder ve ne şekilde kullanır ?

Veriler genel olarak insanların girip çıktıkları siteler kullandıkları porgramlar sayesinde  kullanıcıların herbir tıktan sonra

arkada bıraktıkları izler toplanarak elde edilir.İşte burda önemli olan kısım bu bilgilerin elde edilme ve yorumlanması için

gerekli malzemeler nelerdir. Veriler python veya beatifulsoup kullanılarak edilebilir. Tabi günümüz dünyasında biriken bu

kadar bilgi olunca çok bilgi toplamak değilde bu bilgileri en iyi şekilde yorumlamak daha önemlidir. İşte bunun için;   

  • İyi bir matematik bilgisi
  • İstatistik
  • Bu bilgilere ulaşmak için bilgisayar bilgisi’ne

ihtiyaç duyulmaktadır. Peki bu data science ile günlük hayatımızda nerelerde karşılaşıyoruz. Data science’ın ilk 

olarak kullanıldığı  yer Google page rank’tır. Aynı zamanda facebook, twitter gibi siteler bunu tanıyor olabileceğimiz  kişiler 

gibi bazı hizmetlerinde aktif olarak kullanır.

  Yani aslında biz farketmemiş olsak bile data science uzun bir süredir aktif kullanıldığı şekliyle aramızda bulunuyor

.  Amazonun bu günlere gelmesinin başlıca sebeplerinden birisi de data science’tır.

   Bir data scientist gözünden bakacak olursak data nerededir ve datayı elde etmek için ön hazırlıklar ne olabilir ?

Data her ortamdadır ve her ortamda olacaktır. Astronomide, bilgisayarda, telefonda,pazarlamada, alışverişte başlıca büyük

datalar gözlenebilir. İşte tam bu noktada datacı bu  data havuzunu farkedip kullanılabilecek en büyük datayı elde edip, bu

datayı verimli bir şekilde işlemek ve matematik yardımıyla istatistik oluşturup yeni bilgiler elde etmelidir.  

     Bu kadar yaygın bilgisayar,telefon ve internet kullanımından ve teknolojinin bu kadar gelişmesinden sonra dünya

üzerinde takip edilecek o kadar çok data oluştu ki artık data science insan hayatında çok daha büyük bir yer kaplamaya

başladı. Bu da data scince’ın önlenemez gelişimini doğurdu ve data scince günümüzün en popüler mesleklerinden biri

haline geldi. Kulaktan dolma bilgilerime göre astronomi alanında insanlık tarihinden 2009’a kadar olan sürede ortaya çıkan

bilgilerin, 2009’dan günümüze kadar elde edilen bilgilerin ancak yarısına eşit  olduğuydu. Doğru olduğu varsayılırsa datanın

nasıl korkunç bir şekilde büyüdüğünün en büyük göstergesi olabilir. Nitekim Bing’te Sr. Product Manager olarak çalışan

Duane Forrester‘da “5 exabyte data 2012’de 2 gün içerisinde, 2013’te 10dk içerisinde 2015’te ise kahve alırken üretiliyor.” 

diyerek verdiği bilgi bu bilgilerin doğruluğunun en büyük göstergesidir.

    Size data science hakkında okuduğum birkaç makale ve bazı videolar ışığında edindiğim bilgilerden bir mukaddime

sunmaya çalıştığım. İnşaAllah ilerde kendimi geliştirdikçe burda size sunacağım bilgiler aynı oranda gelişecektir.    

veri

Reklamlar