IMDb
2024
Menganalisis dataset film dengan SQL (BigQuery)

Rincian Proyek
Tahun
2024
Tautan
Baca keseluruhan PDF disini
Repository GitHub
Seperti yang mungkin Anda ketahui, IMDb adalah salah satu database film paling populer dan lengkap, yang menawarkan data lengkap tentang film, acara TV, dan konten terkait. Untuk proyek ini, saya ingin menunjukkan keterampilan saya dalam SQL (BigQuery) menggunakan kumpulan data yang tersedia di Kaggle. Saya bereksperimen dengan beberapa hipotesis dan pertanyaan yang saya buat sendiri untuk menentukan tren dalam rating, genre, dan kinerja sutradara.

Alat Analisis
Karena proyek ini secara khusus dirancang untuk menunjukkan kemampuan SQL saya dan menganalisis tren dalam rating film, genre, dan kinerja sutradara, saya menggunakan SQL (BigQuery) untuk mendapatkan wawasan utama. Untuk visualisasi, saya menggunakan Looker.

Hasil Akhir
Melalui proyek ini, saya tidak hanya sekedar mempelajari kueri SQL tingkat lanjut seperti CTE dan JOIN, tetapi saya juga menemukan temuan tentang genre film paling populer selama era pandemi (2019–2024), korelasi antara jumlah film yang dibuat sutradara dan peringkat film rata-rata mereka, serta film dengan peringkat teratas secara keseluruhan. Selain itu, saya akhirnya memahami cara menggunakan Looker untuk membuat visualisasi dengan menghubungkan hasil kueri SQL secara langsung ke Looker.