Teknolojinin çığ gibi büyümesi ile beraber, internet ortamında kullanıcıların arkalarında bıraktıkları izin, (arama alışkanlıkları, konumu, dili, araştırmaları, blogları, sosyal medya hesapları vb.) yani bireysel ve kurumsal verilerin, dünyaya paylaşılması çekiciliğini artırarak yeni bir kavramın doğuşuna da yol açtı: BIG DATA.
İnternette gezinirken, örneğin beyaz renkli, hakim yaka bir tişört baktınız. O siteden çıktığınızda ve sosyal medya hesaplarınıza girdiğinizde karşınıza beyaz renkli hakim yaka tişört önerileri çıkacaktır. Bu hepimizin dikkatini çeken bir olaydır. İşte bu, milyonlarca kişinin dijital ayak izinin nasıl depolanıp, nasıl işlendiğinin ve nasıl kullanıldığının en basit örneğidir.
Hepimizin bildiği bir uygulama olan Netflix, big datayı analiz eden, işleyen ve kullanıcıya ait doğru ürünü çıkarabilen bir sistem geliştirdi. Kullanıcıların daha önce izlediği dizi, film veya belgeselleri, bu içeriğe ait türü, oyuncuları, geçirilen süreyi, yapımcıyı, yönetmeni, senaristi… Böyle böyle birçok veriyi işleyerek kullanıcıya izlediği içeriğe benzer içerikler sunarak, kategorilendirme yaparak, kısacası büyük bir algoritmayı harika bir şekilde çözümleyerek dünyanın en çok kullanılan uygulaması haline geldi. İşte big data kavramının önemi!
Şimdi gelelim big datanın hangi alanlarda kullanıldığına.
Big datanın kullanım alanı çok geniştir. Hemen hemen her alanda karşımıza çıkar.
Bankalar ellerindeki verileri işleyerek para hareketleri, çapraz satış, risk yönetimi gibi farklı alanlarda big datadan yararlanıyorlar, tabii ki müşterilere ait bu bilgilerin gizlenmesi için üretilen gizlilik çözümlerinde de yine büyük verinin kullanımı sağlanıyor. Yani burada görüyoruz ki big data kullanımı kendi kendine iş kolu da sağlayan bir alan.
Big datanın en çok kullanıldığı ve belki de gerçekten en çok fayda sağladığı alanlardan biri de Sağlık Hizmetleri. Hastaların sağlık kayıtlarına, hastalık geçmişlerine, tedavilerine ve o tedavilere ilişkin hastalıklarının genel seyrindeki değişimlere bakılarak çeşitli analizlerle big data testi yapılarak, belirli tedavi yöntemlerinin saptanması, bulaşıcı hastalıkların tespiti, ilaç endüstrisinin gelişimi ve buna benzer birçok konuda algoritma oluşturulması ile gelişme kaydedilmesine olanak tanır. Galiba bizleri korkunç hastalıklardan kurtardığı ya da en azından bir kaçış yolu sunduğu için bu algoritmayı sağlayanlara büyük bir minnet borçluyuz.
Yine devlet içi faaliyetlerde de big data kullanımı büyük önem arz eder. Nüfus sayımları, seçim sonuçları, bütçe raporları gibi birçok verinin depolanması ve kullanılması devlet hizmetlerindeki kalitenin artmasına ve çeşitlendirilmesine olanak sağlar. Big datanın devlet hizmetlerinde kullanılmasının en önemli örneklerinden biri E-Devlet uygulamasıdır. Kişinin hem devlet hizmetlerine olan ulaşımını hem de kişisel bilgilerine erişimini kolaylaştıran, dolayısıyla sunulan hizmetlerin etikliğinin ve verimliliğinin artmasına ve bu yöntemle de hızlı ve güvenilir biçimde kullanılmasına olanak tanır.
Şimdi, örneklerini gördüğümüz ve biraz olsun kafamızda yer eden big datanın özelliklerine bakalım. Tabi ki elimizdeki her veri “Big Data” sayılmıyor. Big data olabilmesi için belli başlı özellikleri barındırması gerekiyor. Peki nedir bu özellikler?
Büyük veri dediğimiz veriler 5 farklı bileşeni barındırır. Buna 5V kavramı deriz.
Variety (Çeşitlilik): Teknolojinin artmasıyla elimizdeki veri çeşitliliği de arttı. Şimdilerde veriler hepimizin bildiği üzere tek bir formatta değiller. Text formatında, video formatında, PNG, JPEG, txt, xml, CSV ve daha birçok formatta olabiliyor. Sağlıklı bir çalışma için çeşitli formattaki bilgilerin, birbirine dönüştürülebiliyor olmaları önemlidir. Dolayısıyla big datalar, içlerinde birçok formatı barındırırlar.
Velocity (Hız): Elimizde bulunan devasa büyüklükteki verilerin devamlılık arz etmeleri için hızlı olması gerekmektedir ancak aynı verilerin işlenebilmesi ve analiz edilebilmesi için de yine üretimdeki hıza eşdeğer bir hızda olması gerekmektedir. Bu nedenle hız kavramı da big data testinde önem arz eden bir kavramdır.
Volume (Hacim): Geçtiğimiz 10 yılda veri miktarı 40 kattan fazla bir artış göstermiş fakat veri depolama için yapılan harcamalar ise 1,5 kat artmıştır. Bu durum, elde edilen verinin doğru ve verimli şekilde depolanması için çok iyi bir kurgulama gerektiğini ortaya koymaktadır.
Veracity (Doğruluk): Verinin güvenilir ve doğru bilgiler içermesi gerekir. Verilerin içindeki doğru olmayan ve anlamsız kayıtların sağlıklı sonuç alabilmek adına temizlenmesi gerekmektedir. Doğru olmayan veri zaten anlamlı bilgiye dönüştürülemez.
Value (Değer): Büyük veri ile ilgili en önemli bileşen, değerdir. Elde edilen ve işlenen veriler, kuruma değer kattığı sürece anlamlıdır. Bu nedenle, büyük verinin analizinin ve simülasyonlarının doğru şekilde kurgulanması ve büyük veriyi kullanan kuruma fayda sağlaması öncelikli olarak ele alınmalıdır.
Gelelim big datanın nasıl işlendiğine.
En faydalı bilgiye ulaşabilmek için elde bulunan, depolanmış haldeki verinin etkili biçimde analiz edilerek sade ve işlenebilir halini ortaya koymak gerekiyor. Bunun için birçok veri noktasının karşılaştırılması, birbirleriyle olan ilişkisinin çözümlenmesi gerekmektedir. Bu da yaygın olarak, toplanan verinin belirli analizler sonucu işlenerek bir yapı modeli oluşturması ve daha sonra bu yapı modeli üzerinden simülasyonlar yapılarak, her seferinde veriye ait noktaların yeri değiştirilerek sonuçlarının nasıl etkilendiği yönündeki izlenimler ve bulgularla saptanmaktadır.
Ancak geçmişe baktığımızda veriler, elektronik tablolar ve veri tabanları üzerinden işleniyordu, günümüzde veri kavramı çok karmaşık bir yapı haline geldi. Veriler artık sadece veri tabanları ile sınırlı kalmıyor, videolardan fotoğraflara, ses kayıtlarına, sensörlere ve yazılı metinlere kadar birçok formatı kapsıyor. Dolayısıyla verinin segmentlere ayrılması ve işlenmesi karmaşık hale geldiğinden şirketler kendi big data yatırımlarını yapmak zorunda kalıyorlar.
Büyük verilerin işlenmesi ve analizi hususunda dikkat edilmesi gereken belli başlı maddeler vardır. Bu süreci 5 aşamada inceleyebiliriz.
- Öncelikle soru tanımlaması ile başlamalıyız. Verinin analiz edilebilmesi için doğru sorularla başlanması gerekmektedir. Sorular ölçülebilir, kısa ve net, spesifik ve duruma uygun olmalıdır.
- Ölçüm yapılacak olan değer nedir? Biz neyi ölçüyoruz? Sorularının net bir cevabi olmalıdır. Neyin nasıl ölçüleceği ve soruların cevaplarına bağlı olarak, hangi niteliklere göre ölçüleceği önceden belirlenmelidir.
- Sorular ve ölçüm öncelikleri belirlendikten sonra sıra veri toplama işine gelmektedir. Önce eldeki kaynaklar değerlendirilmeli, toplanan veri sistematik bir şekilde kolay ulaşılabilecek formata ve düzende olmalıdır. Sonrasında eksik veriler tespit edilerek veri toplama işi tamamlanmalıdır.
- Bütün bu aşamalardan sonra eldeki tüm bulgular toplanarak analizi gerçekleştirilir. Eldeki kriterlere ve ulaşılmak istenilen sonuca göre veriler analiz edilerek değerlendirmeler yapılır.
- Veriler toplandı, analizler yapıldı şimdi sıra sonuç kısmında. Sonuçları yorumlayabilmek için istenen ve elde edilen şeylerin örtüşüp örtüşmediği kontrol edilir. Veriler sorulan sorulara cevap veriyor mu? Olası bir itiraza karşı savunma yapılabilecek yeterliliğe sahip mi? Geliştirilebilecek yönleri var mı? Hangi seçenekleri sunuyor? Bu gibi birçok sonucun yorumlanması ile big datanın işleme geçmesi ve kullanılması sağlanır.
Evet, görüldüğü üzere hayatimizin her alanında big data ile karşı karşıyayız. Doğru kurgulandığı ve kullanıldığı taktirde sağlıktan bankacılığa, moda trendlerinden devlet hizmetlerine kadar birçok alanda bizlere ne kadar kolaylık sağladığını ve şirketlere de gelişebilmeleri açısından satış, pazarlama, üretim, dağıtım, arz ve talep gibi birçok konuda ivme kazandırdığını görüyoruz.
KAYNAKÇA: http://www.teknolojidenbihaber.com/buyuk-veri-big-data-kullanan-13-uygulama-alani/ http://www.gtech.com.tr/big-data-buyuk-veri-analizi-nasil-yapilir/ http://www.mysoft.com.tr/buyuk-veri-big-data