Fail-safe-design

  • Published on
    Firmware yang berjalan dengan benar di meja uji belum tentu andal di lapangan. Reliability bukan hanya tentang tidak crash, tetapi tentang bagaimana sistem merespons error, bagaimana state dipertahankan saat gangguan terjadi, serta bagaimana kegagalan dapat diamati dan dianalisis. Artikel ini menyatukan seluruh mental model Foundation—execution, memory, OOP, layering, dan communication—ke dalam perspektif reliability sistem. Kita membahas fail-safe thinking, observability, error visibility, serta batas antara pemahaman konseptual dan disiplin produksi. Artikel ini menjadi transisi resmi menuju seri Production yang mengunci aturan dan boundary secara eksplisit.
  • Published on
    Artikel ini mengunci model reliability dan error handling untuk firmware ESP32 produksi. Setelah dependency, memory, layering, concurrency, dan communication dibekukan, sistem masih bisa gagal jika tidak memiliki model propagasi error yang eksplisit dan fail-safe state yang jelas. Silent failure, printf liar, watchdog tanpa owner, serta relay fail-open adalah penyebab utama bug lapangan yang sulit diaudit. Artikel ini menetapkan error enum eksplisit, larangan exception, encapsulation watchdog dalam HealthService, logging via interface non-blocking, serta kewajiban health telemetry minimal. Dengan reliability model formal, firmware tidak hanya rapi, tetapi juga dapat diaudit dan dipertahankan bertahun-tahun.