Data analytics adalah proses menganalisis data mentah untuk mengumpulkan informasi yang relevan untuk pengambilan keputusan yang lebih baik. Hal ini terutama digunakan di banyak organisasi untuk membuat keputusan bisnis. Yah, Analisis big data melibatkan sejumlah besar data dan proses ini cukup kompleks, maka perusahaan menggunakan strategi yang berbeda.
Sebagai contoh, Facebook adalah salah satu yang didorong data yang terkemuka dan perusahaan gudang data terbesar di dunia. Gudang data Facebook sendiri disimpan dalam Hadoop untuk komputasi skala besar. Kemudian, ketika gudang data tumbuh menjadi Petabyte, mereka memutuskan untuk mengembangkan sistem baru dengan latency rendah. Di tahun 2012, anggota tim Facebook merancang "Presto" untuk Analisis query interaktif yang akan beroperasi dengan cepat bahkan dengan data Petabyte.
Apakah Apache Presto?
Apache Presto adalah mesin eksekusi query paralel yang terdistribusi yang dioptimalkan untuk latency rendah dan Analisis query interaktif. Presto menjalankan query dengan mudah dan timbangan tanpa turun waktu bahkan dari Gigabyte sampai Petabyte.
Permintaan Presto tunggal dapat memproses data dari berbagai sumber seperti HDFS, MySQL, Cassandra, HIVE dan sumber data lebih banyak. Presto dibangun dengan JAVA dan mudah untuk mengintegrasikan dengan komponen infrastruktur data lainnya. Presto sangatlah handal, dan perusahaan - perusahaan terkemuka seperti Airbnb, DropBox, Groupon, Netflix mengadopsi itu.
Fitur Utama Apache Presto
Presto memiliki fitur - fitur sebagai berikut.
- Arsitektur sederhana dan extensible.
- Pluggable connectors - Presto mendukung pluggable konektor untuk menyediakan metadata dan data untuk query data.
- Pipelined executions - menghindari overhead latensi I/O yang tidak perlu.
- User-defined functions - analis dapat membuat fungsi kustom didefinisikan oleh pengguna sendiri untuk imigrasi data dengan mudah.
- Vectorized columnar processing.
Manfaat Apache Presto
Berikut adalah daftar manfaat bahwa Apache Presto :
- SQL operasi khusus / Specialized SQL operations
- Mudah untuk menginstal dan debug
- Sederhana penyimpanan abstraksi / Simple storage abstraction
- Memiliki skala kecepatan mencapai Petabyte data dengan latency rendah
Aplikasi Presto
Presto mendukung kebanyakan aplikasi industri terbaik hari ini. Mari kita lihat beberapa aplikasi terkenal.
- Facebook − Facebook dibangun dengan Presto untuk kebutuhan analisis data. Presto memudahkan karena mencakup skala besar serta dengan kecepatan data yang cepat.
- Teradata − Teradata menyediakan solusi end-to-end di Big Data analytics dan data warehousing. Kontribusi Teradata Presto membuatnya lebih mudah untuk lebih banyak perusahaan untuk mengaktifkan semua kebutuhan analisis.
- Airbnb − Presto merupakan bagian integral dari infrastruktur data Airbnb. Yah, ratusan karyawan menjalankan query setiap hari dengan teknologinya.
Mengapa Presto?
Presto mendukung standar ANSI SQL yang telah membuatnya sangat mudah untuk data analis dan pengembangan. Meskipun itu dibangun di Java, ia menghindari masalah-masalah khas kode java yang terkait dengan memori alokasi serta sampah koleksi. Presto memiliki arsitektur penghubung yang ramah dengan Hadoop. Hal ini memungkinkan untuk dengan mudah plug dalam sistem file.
Presto berjalan pada beberapa distribusi Hadoop. Selain itu, Presto dapat menjangkau dari platform Hadoop untuk query Cassandra, database relasional, atau toko data lainnya. Kemampuan analisis cross-platform ini memungkinkan pengguna Presto untuk mengekstrak nilai bisnis maksimum dari gigabyte hingga petabyte data.