10 Büyük Veri Yazılım Gereksinimi

Depoladığınız veri size neler kazandırabilir? Eğer elinizde onu analiz edebilecek ve analizlerinizde çıkan sonuçları doğru biçimde raporlayacak yazılımınız yoksa eliniz boş demektir. Peki Büyük Veri için yazılım gereksinimleri neler? Bu sorunun cevabı projeden projeye değişebilir fakat sizin için ortak noktaları bir araya toplamaya çalıştık.

1- Hadoop ve MapReduce

Hadoop, Büyük Veri için depolama ve işleme yapabilen açık kaynak kodlu bir platform sunuyor. MapReduce ise yüzlerce hatta binlerce sunucu içerisinde size ölçeklendirebilirlik sağlayan bir yazılım.

2- Veritabanı/Dosya Sistemi

Hadoop Distributed File System (HDFS) sayesinde gerekli olan veri ve veritabanının depolanmasını ve hesaplanmasını sağlayabiliyorsunuz.

3- Pig Latin

Pig, Hadoop ile birlikte MapReduce yazılımını yaratabileceğiniz yüksek derecede bir platform ve bu platformun dili Pig Latin olarak anılıyor.

4- Hive Veri Ambarı

Apache Hive, Hadoop’un en üst katmanında veri ambarı oluşturabileceğiniz bir platform.BigDataComponents_600

5- Cascading

Cascading bir Java uygulaması. Bu uygulama sayesinde zengin veri analitiği ve veri yönetimi için uygun bir yapı oluşturabilirsiniz.

6- Büyük Veri Entegrasyon Araçları

CR – X gibi yarı otomatik modelleme araçları hızlı etkileşime sahip geliştirmeye olanak sağlayacak ve analitik çalışacak veritabanını yapılandırmanız için size yardımcı olabilir.

7- Analitik Veritabanı

Veritabanınızı analize uygun şekilde uzmanca hazırlamalısınız. Pivotal Greenplum veya IBM Netezza gibi uygulamalar analitik modelle için hızlı yükleme ve yeniden yükleme özellikleri sunarlar.

8- Müşteri Memnuniyeti

ClickFox gibi uygulamalar müşteri memnuniyeti konusunda size yardımcı olacak özellikler sunuyorlar.

9- İşlemsel Yaklaşımlar

İşlemsel büyük veri projeleri gerçek zamanlı olmadığı sürece Hadoop’u kullanamazlar. Bunun için verileri Hadoop’a uygun hale getirmelisiniz.

10- Resmi İyi İnceleyen

Sizin için örnek oluşturacak yapı aşağıdaki resimde gösterilmiştir.