Python Language Programming atau biasa kita sebut dengan bahasa pemrograman python adalah salah satu bahasa komputer yang sering dipakai pada bidang data science. Untuk memudahkan mempelajari dan membuat project data science, python memiliki banyak library yang bisa digunakan dengan mudah. Berikut merupakan 10 library python terpopuler untuk data science:
- Pandas
Pandas merupakan salah satu library python untuk mengolah dataframe. Pandas dapat digunakan dengan mudah dan cepat. Pandas sering digunakan untuk data wrangling. Mulai dari membaca data, menghapus data, update data, manipulasi data, menghadle data kosong, dan lainnya.
- Numpy
Numpy merupakan salah satu library python untuk pengoperasian data array. Yang bisa dilakukan dengan library ini adalah menambah, menghapus, mengganti ukuran data, dan lainnya.
- Scikit Learn
Scikit learn merupakan salah satu library python untuk pemodelan Machine Learning. Saat ingin membuat model Machine Learning seperti klasifikasi, regresi maupun clustering maka scikit learn selalu digunakan. Berbeda dengan Pandas dan Numpy, scikit learn berfokus pada pemodelan, bukan manipulasi data.
- Matplotlib
Matplotlib merupakan salah satu library python untuk visualisasi data. Untuk menghasilkan grafik dengan bahasa pemrograman python, library ini sangatlah membantu dalam pembuatannya. Matplotlib juga mudah digunakan. Terdapat banyak grafik yang bisa dibuat dengan library ini seperti bar chart, line chart, pie chart, scatter plot, histogram, dan lainnya.
- Seaborn
Seaborn merupakan salah satu library python untuk visualisasi data. Sebenarnya seaborn merupakan matplotlib versi lebih canggih. Grafik yang dihasilkan seaborn lebih menarik dan lebih canggih dengan sintaks yang lebih sedikit.
- Tensorflow
Tensorflow merupakan library python yang cocok digunakan untuk data dengan jumlah yang besar. TensorFlow menyediakan API tingkat tinggi dan tingkat rendah dan digunakan untuk model high performance. Tensorflow mempunyai arsitektur yang kompleks dan tidak mudah digunakan.
- Keras
Keras merupakan high level API dari TensorFlow untuk membangun dan melatih kode Deep Neural Network. Berbeda dengan tensorflow, keras mempunyai arsitektur yang simpel dan mudah digunakan. Keras juga dibuat khusus untuk python sehingga jauh lebih ramah pengguna, modular, dan dapat mudah disusun daripada TensorFlow.
Selain tujuh library tersebut, pada bidang science juga menggunakan banyak library python seperti scipy, statsmodels, pytorch, plotly dan lain sebagainya.