Thursday, June 5, 2014

Dasar-dasar troubleshooting UNIVERSAL

Problem ... pada sistem apa saja... hanya ada dua macam :

1. Intermittent          : random, ngacak, nggak bisa diulang, misterius, jarang2 terjadi.
2. Reproduceable   : bisa diulang, ada polanya. biasanya frekuensinya tinggi.

Yang reproduceable PASTI ada solusinya. Karena bisa diulang, kita tinggal cari polanya. Begitu polanya ketemu, sumber masalahnya ketemu tinggal di solve (ini akan dijelaskan di docs lain).Musuhnya cuma satu : deadline.. waktu.

Yang intermittent PASTI NGGAK ada solusinya. Kalau dia nggak bisa diulang, loe nggak bisa cari polanya thus nggak bakal ketemu solusinya. You can't shoot a trouble you can't see. Karenanya jenis problem ini sering diabaikan.

Pertanyaannya sekarang ketika problem muncul bagaimana mengenali ini problem intermittent atau reproduceable ?

Itulah gunanya troubleshooting -menentukan problem itu ada polanya apa nggak.

Caranya macam :
1. Studi pustaka
Kita pelajari detail teorinya dan mencocokannya dengan problem yang ada. Apa yang menyimpang dari teori biasanya sumber masalah. Teori yang jadi acuan ini ada dua macam :
- Teori yang berdasarkan desain : manual, handbook, Standar...dll
- Teori yang berdasarkan pengalaman : Best practice, tips and tricks... dll.
 >Karakteristik :
    # risiko        : rendah
    # efektifitas : rendah
    # efisiensi   : rendah 

2. Eliminasi
Atau trial n error atau pembuktian mundur.Kita tebak saja suatu komponen sebagai penyebab problem itu lalu kita buktikan. Kalau berhasil ya komponen itu problemnya kalau gagal, problem nggak pada komponen itu, kita tuduh lagi komponen lain. Misalnya untuk membuktikan kerusakan ada pada vga atau monitor, kita pasang saja monitor pada vga yang diyakini ok. Kalau monitor nyala normal, konfimr vga yang rusak. Tapi kalau ngaco juga, ya monitornya yang rusak.Efektifitas cara ini bergantung seberapa cerdas anda dalam memilih apa yg harus dituduh.
Kalau monitor rusak yang anda tuduh adalah mousepad-nya... ya kudu sabar karena untuk sampai pada tuduhan yang benar akan cukup lama.
>Karakteristik :
    # risiko        : tinggi
    # efektifitas : tinggi
    # efisiensi   : tingg

3. Rollback
Atau studi log atau investigasi kronologis.Ini efektif kalau sudah pernah ada sejarah sistem berjalan dengan baik. Jadi ketika problem muncul ya ditelusur mundur saja sejak problem terjadi hari-hari sebelumnya. Bisa ditebak peranan logs jadi besar. Jadi prasyaratnya ya.. dr awal lognya harus beres. Kalau dinyalakan hanya ketika problem... ya nggak ada gunanya. Tapi kalau sistemnya nggak ada data, jadi enak... mirip deepfreeze yang dipakai warnet2. Ada apa-apa ya mundur ke zaman semuanya aman tentram. Nama keren.
 >Karakteristik :
     # risiko         : sedang
     # efektifitas  : sedang
     # efisiensi    : tinggi 

No comments:

Post a Comment