Tugas Seleksi Ca-IRK 2018
Membuat algoritma linear regression dari 0.
Seperti yang telah kalian pelajari pada mata kuliah Probabilitas dan Statistika, terdapat suatu algoritma yang bernama Regresi Linier (Linear Regression). Buatlah algoritma Regresi Linear versi kalian sendiri dan cobalah memakai algoritma tersebut untuk memproses dataset!
- Buatlah algoritma Linear Regression FROM SCRATCH
- Program ditulis dalam bahasa Python dengan menggunakan kakas Jupyter Notebook
- Class Linear Regression ditulis pada file Python (.py) (Jangan lupa untuk didokumentasikan dengan baik).
- Class Linear Regression yang dibuat tadi lalu di-import dan digunakan pada Notebook (.ipynb).
- Program pada Notebook melakukan hal-hal dibawah ini:
- Mengambil data CSV (link ada di bawah)
- Memproses data mentah
- Melakukan splitting dataset (yang telah diproses) untuk Train dan Test.
- Memasukkan data Train ke algoritma Linear Regression yang sudah kalian buat.
- Melakukan prediksi terhadap data Test.
- Menunjukkan akurasi dari algoritma yang telah dibuat terhadap dataset yang diberikan.
- Memvisualisasikan hasil prediksi dengan scatter plot (untuk datanya) + line plot (untuk modelnya).
- Fork repository ini.
- Tambahkan source code kalian.
- Ubah README ini menjadi berisikan:
- Nama / NIM
- Dasar Teori Regresi Linier
- Penjelasan singkat kode sumber
- Referensi
- Lakukan Pull Request dengan Format: Nama - NIM
- Personal Chat Leonardo W. (kontak ada di grup Ca-IRK 2018), merundingkan jadwal demo tugas.
- Demo berlangsung selama 15 menit.
- Demo dilakukan di Google Meet.
- Boleh menggunakan Library apapun asalkan bukan implementasi Linear Regression yang sudah ada (cth: Scikit-Learn).
- Algoritma Linear Regression dapat digunakan untuk jumlah atribut berapapun (kecuali 0).
- Algoritma Linear Regression hanya dapat menerima atribut-atribut numerik (
float
/int
).- Apabila terdapat atribut non-numerik, diharapkan untuk diproses terlebih dahulu.
- Data CSV yang dipakai dapat di-download pada link berikut.
- AKAN TETAPI diperbolehkan menggunakan dataset lain.
- Gunakan bahasa Julia (.jl) (Julia juga dapat digunakan pada Jupyter Notebook)
Untuk mengerjakan bonus:
- Julia Documentation: https://docs.julialang.org/
- Julia Cheatsheet: https://cheatsheets.quantecon.org/julia-cheatsheet.html
Max Point: 2000
Bonus: + 750
==================================================================
*Segala pertanyaan dapat ditanyakan melalui LINE Group Ca-IRK 2018 atau dapat melalui pc langsung.