Інженерія надійності електросамоката як 28-ма engineering axis: meta-вісь усіх engineering-axes — MIL-HDBK-217F Notice 2 + IEC 61709:2017 + FIDES Guide 2009 Edition A + Telcordia SR-332 Issue 4 + IEEE 1413-2010 + JEDEC JEP122H + IEC 62308:2006 + ISO/IEC 25023:2016 + IEC 60300 + IEC 60812:2018 FMEA + IEC 61025 FTA + MIL-STD-1629A FMECA + Hobbs HALT/HASS + Weibull/Arrhenius/Eyring/Coffin-Manson/Norris-Landzberg
У серії інженерного гайду ми описали акумуляторну батарею з BMS і thermal runaway intro, гальмівну систему, мотор і контролер, підвіску, шини, світло і видимість, раму й вилку, display + HMI, зарядний пристрій SMPS CC/CV, connector + wiring harness, IP-захист, bearingи з ISO 281 L10, стеблину і механізм складання, деку, handgrip + lever + throttle, колесо як assembly, інженерію різьбових з’єднань як joining-axis, термоменеджмент як heat-dissipation axis, EMC/EMI як interference-mitigation axis, кібербезпеку як interconnect-trust axis, NVH як acoustic-vibration-emission axis, функціональну безпеку як safety-integrity axis, інженерію життєвого циклу батареї як sustainability axis, ремонтопридатність як repairability-axis, environmental robustness як environmental-conditioning axis та privacy і захист персональних даних як privacy-preservation axis. Ці 27 engineering-axes описали підсистеми, способи з’єднання, теплові й електромагнітні явища, безпеку, sustainability, ремонтопридатність, environmental conditioning і privacy — кожна епізодично посилалася на reliability-концепти (L10 у підшипниках, IFR у BMS, MTBF у моторі, ALT у конекторах), але жодна з них не описала сам інструментарій reliability engineering: як обчислюється MTBF цілої системи з component-level FIT rates, як валідується через ALT/HALT, як інтерпретується Weibull-аналіз польових return-ів.
Reliability engineering — це meta-axis усіх інших engineering-axes. Вона надає формальний апарат (probability distributions, hazard functions, RBD), стандарти для quantitative prediction (MIL-HDBK-217F + IEC 61709 + FIDES + Telcordia SR-332), протоколи валідації (ALT/HALT/HASS per Hobbs) і процесні інструменти (FMEA + FTA + FRACAS + DRBFM), що дозволяють прогнозувати і валідувати надійність кожної з 27 попередніх axes до випуску на ринок і протягом життєвого циклу.
Це двадцять восьма engineering-axis deep-dive у серії гайду — і одинадцята cross-cutting infrastructure axis (паралельна до joining DT + heat-dissipation DV + interference-mitigation DX + interconnect-trust DZ + acoustic-vibration-emission EB + safety-integrity ED + sustainability EF + repairability EH + environmental-conditioning EJ + privacy-preservation EL, тепер reliability-prediction EN). На відміну від попередніх axes, що описували окрему підсистему або окремий аспект, reliability-axis є інтегральною: вона не має власної “залізної” реалізації — натомість це методологія, що накладається поверх кожної іншої axis.
1. Reliability ≠ functional safety ≠ maintenance: окрема axis
Reliability, functional safety і maintenance часто плутають, але вирішують різні задачі:
| Вимір | Reliability (EN) | Functional safety (ED) | Maintenance |
|---|---|---|---|
| Питання | Скільки годин до відмови? | Що станеться при відмові? | Як швидко відновити після відмови? |
| Метрика | MTBF, FIT, R(t) | SIL/ASIL level, PFD/PFH | MTTR, availability |
| Стандарт-фундамент | MIL-HDBK-217F + IEC 61709 + FIDES + Telcordia SR-332 | IEC 61508 + ISO 26262 + ISO 13849 | IEC 60300-3-14 + EN 13306 |
| Інструмент аналізу | FMEA + FTA + RBD + Weibull | HARA + PHA + SIL-decomposition | RCM (Reliability-Centered Maintenance) |
| Технічна ціль | Запобігти відмові статистично | Якщо відмова — failsafe state | Скоротити downtime |
| Цикл валідації | ALT/HALT/HASS + field MTBF | SIL audit + safety case | MTBF/MTTR ratio measurement |
| Тригер | “Скільки протримається?” | “Що буде при відмові?” | “Як ремонтувати?” |
Класичний приклад розмежування: гальмівна система e-самоката з SIL-2 hardware (functional safety) і MTBF 50 000 годин (reliability). Functional safety-axis виконано досконало — при будь-якій detected відмові система переходить у failsafe state (mechanical brake takes over). Reliability-axis при цьому окрема задача: яка ймовірність that detected failure відбудеться в перший рік (Weibull β < 1 — infant mortality) vs після п’ятого року (β > 1 — wear-out)? Це не питання functional safety — це питання reliability engineering.
2. Reliability function R(t), failure rate λ(t), MTBF, MTTF, MTTR, FIT
Reliability function R(t) — ймовірність, що компонент функціонує без відмови протягом часу [0, t]:
R(t) = P(T > t), де T — випадковий час до відмови
Cumulative distribution function (CDF) F(t) — ймовірність відмови до часу t:
F(t) = 1 − R(t) = P(T ≤ t)
Probability density function (PDF) f(t) — щільність розподілу часу до відмови:
f(t) = dF(t)/dt = −dR(t)/dt
Failure rate (hazard rate) λ(t) — миттєва ймовірність відмови за умови виживання до часу t:
λ(t) = f(t)/R(t)
Це не ймовірність — це інтенсивність (1/time), і саме вона має фізичний сенс bathtub curve (див. § 3).
MTBF (Mean Time Between Failures) — для ремонтопридатних систем, середній час між послідовними відмовами:
MTBF = ∫₀^∞ R(t) dt (для repairable systems with restoration to as-good-as-new)
MTTF (Mean Time To Failure) — для не-ремонтопридатних компонентів, очікуваний час до першої відмови:
MTTF = E[T] = ∫₀^∞ t · f(t) dt = ∫₀^∞ R(t) dt
(Для exponential distribution MTBF = MTTF = 1/λ; для інших розподілів — різниця суттєва.)
MTTR (Mean Time To Repair) — середній час відновлення після відмови. Не reliability per se, але входить у availability:
A = MTBF / (MTBF + MTTR)
FIT (Failures In Time) — кількість відмов на 10⁹ годин експлуатації (стандартизована одиниця для component-level reliability):
FIT = λ × 10⁹ (відмов на мільярд годин)
Типові порядки FIT: passive resistor — 0.1 FIT, MOSFET silicon — 5–50 FIT, electrolytic capacitor — 100–500 FIT, BLDC motor — 5 000–20 000 FIT, lithium-ion cell — 1 000–10 000 FIT (per FIDES Guide 2009A + Telcordia SR-332 Issue 4).
3. Bathtub curve: три фази життя
Емпірично спостережувана bathtub curve описує λ(t) типового electronic/electromechanical компонента у трьох фазах:
| Фаза | Назва | Тривалість | λ(t) поведінка | Weibull β | Домінуючий механізм |
|---|---|---|---|---|---|
| 1 | Infant mortality (early failure) | 0 – 1 000 год | Decreasing failure rate (DFR) | β < 1 | Виробничі дефекти: solder void, contamination, weak die-attach |
| 2 | Useful life (steady state) | 1 000 – 100 000 год | Constant failure rate (CFR) | β = 1 | Випадкові тригери: ESD, overstress, transient |
| 3 | Wear-out | > 100 000 год | Increasing failure rate (IFR) | β > 1 | Накопичувальні: electromigration, capacitor dryout, bearing fatigue |
Параметр β Вейбулла (див. § 4) — найкомпактніша характеристика того, у якій фазі знаходиться компонент. Field-return data plottedна Weibull paper негайно показує, у яку з трьох фаз потрапляє більшість returns:
- β < 1 → інженерія мала виробничий defect; рішення: посилити screening (burn-in / HASS).
- β ≈ 1 → відмови випадкові; рішення: збільшити stress margin / redundancy.
- β > 1 → wear-out у фазі гарантії; рішення: переглянути derating / matериал / толерантності.
Інженерна ціль — посунути всю криву донизу і подовжити фазу 2, що досягається трьома практиками: (a) derating (працювати компонент при ≤ 50% rated stress); (b) burn-in screening (відсіювання фази 1 на заводі); (c) wear-out lifetime > intended life (підбір компонентів з MTBF > 5× warranty period).
4. Ймовірнісні розподіли часу до відмови
| Розподіл | Параметри | PDF f(t) | Коли застосовується |
|---|---|---|---|
| Exponential | λ (rate) | λe^(−λt) | Constant failure rate (фаза 2 bathtub), random failures, memoryless |
| Weibull (2-param) | β (shape), η (scale) | (β/η)(t/η)^(β−1) · exp(−(t/η)^β) | Universal: β < 1 = infant, β = 1 = CFR, β > 1 = wear-out |
| Weibull (3-param) | β, η, γ (location) | те саме з зсувом γ | Коли є “garantований” час без відмов (γ > 0) |
| Lognormal | μ (location), σ (shape) | (1/(tσ√(2π))) · exp(−(ln t − μ)²/(2σ²)) | Fatigue, crack growth, corrosion, semiconductor diffusion |
| Normal | μ, σ | (1/(σ√(2π))) · exp(−(t−μ)²/(2σ²)) | Wear-out з симетричним розкидом (рідко в електроніці) |
Розподіл Вейбулла (Waloddi Weibull, “A Statistical Distribution Function of Wide Applicability”, Journal of Applied Mechanics, 1951) — canonical distribution reliability engineering, бо одним параметром (β) описує усі три фази bathtub curve. На Weibull paper plot (ln(ln(1/(1−F(t)))) vs ln(t)) дані утворюють пряму лінію, чий нахил = β і перетин з 63.2% = η (для двопараметричної форми).
Exponential — частковий випадок Weibull при β = 1. Має унікальну memoryless property: P(T > s+t | T > s) = P(T > t). Це означає, що “вже пропрацював 1000 годин — досі fresh для прогнозу”, що не реалістично для wear-out режимів, але точно для випадкових overstress тригерів у фазі 2.
Lognormal — для механізмів, де ушкодження накопичується мультиплікативно (а не аддитивно): crack growth по Paris-Erdogan, corrosion, IMC growth у solder joints. Coffin-Manson cycles-to-failure часто слідує lognormal.
5. Standards corpus — 9-row reliability matrix
| Standard | Рік | Origin | Scope | Ключова метрика |
|---|---|---|---|---|
| MIL-HDBK-217F Notice 2 | 1995 (Notice 2) | US DoD | Parts-stress + parts-count prediction для military electronics | Component FIT з 27 stress factors π |
| IEC 61709:2017 | 2017 | IEC TC56 | Reference conditions + stress models for failure rate conversion | λ_ref + multipliers (π_T, π_U, π_I, π_S) |
| FIDES Guide 2009 Edition A | 2009 | French defence consortium (DGA + Airbus + Thales + Sagem + MBDA) | Industrial reliability handbook covering modern EEE components | Process-factor (manufacturing quality) integrated |
| Telcordia SR-332 Issue 4 | 2016 | Bellcore/Telcordia (telecom origin) | Component reliability prediction, telecom equipment | Method I/II/III (proprietary multiplicative factors) |
| IEEE 1413-2010 | 2010 | IEEE Reliability Society | Framework standard: how to do reliability prediction (not predict values) | Quality criteria for prediction methodology |
| JEDEC JEP122H | 2016 | JEDEC JC-14 | Failure mechanisms and models for semiconductor devices | TDDB, EM, HCI, NBTI, TC acceleration models |
| IEC 62308:2006 | 2006 | IEC TC56 | Equipment reliability — assessment methods | Decision-tree: prediction vs test vs field data |
| ISO/IEC 25023:2016 | 2016 | ISO/IEC JTC1 SC7 | Software product quality measurement (includes reliability) | Software failure intensity, maturity, fault tolerance |
| IEC 60300 series | 2014–2024 | IEC TC56 | Dependability management (umbrella for reliability + availability + maintainability + safety = RAMS) | Programme + processes |
Для e-самоката найбільш operationally relevant: MIL-HDBK-217F Notice 2 і FIDES Guide 2009A — для component-level FIT обчислень (BMS controller IC, motor controller MOSFET, charger SMPS); IEC 61709:2017 — для нормалізації component datasheet λ до actual operating conditions; Telcordia SR-332 — для laboratory burn-in screening models; JEDEC JEP122H — для конкретних failure mechanisms у напівпровідниках (electromigration у power MOSFET, NBTI у MCU CMOS); IEC 62308 — як decision framework: коли робити prediction vs ALT testing vs field tracking.
MIL-HDBK-217F vs IEC 61709 vs FIDES — три конкуруючі prediction methods з різними failure-rate values для тих самих компонентів (різниця до 10×). IEEE 1413-2010 не обирає переможця — натомість вимагає transparency: будь-який reliability claim має документувати метод, data source, assumptions, uncertainty.
6. Acceleration models — 5-row matrix
ALT (Accelerated Life Test) працює тому, що акселератор (підвищена температура, напруга, частота циклів) прискорює ту саму фізичну реакцію, що дає відмову at use conditions. Acceleration factor (AF) — відношення TTF at stress conditions до TTF at use conditions:
AF = TTF_use / TTF_stress
Якщо ALT при stress conditions дає TTF = 100 годин, а AF = 1000, то at use conditions TTF = 100 × 1000 = 100 000 годин (≈ 11 років continuous operation).
| Model | Stressor | Формула AF | Застосовується для | Походження |
|---|---|---|---|---|
| Arrhenius | Temperature | exp((E_a/k_B)·(1/T_use − 1/T_stress)) | Chemical reaction–driven: IMC growth, corrosion, NBTI, oxide breakdown | Svante Arrhenius, “Über die Reaktionsgeschwindigkeit”, Z. Physik Chem. 4, 1889 |
| Eyring | Temperature + secondary stress | (T_stress/T_use) · exp((ΔH/k_B)·(1/T_use − 1/T_stress)) · f(stress) | Rate processes with non-thermal co-stress (humidity, voltage) | Henry Eyring, “The Activated Complex in Chemical Reactions”, J. Chem. Phys. 3, 1935 |
| Inverse Power Law | Voltage / mechanical stress | (V_stress/V_use)^n | Capacitor dielectric, insulation, bearing fatigue | Power-law fits across many domains, formalized in Nelson, “Accelerated Testing”, 1990 |
| Norris-Landzberg | Temperature cycling | (Δf_stress/Δf_use) · (ΔT_use/ΔT_stress)^n · exp((E_a/k_B)·(1/T_max_use − 1/T_max_stress)) | Solder joint thermal fatigue (SnPb, SAC305) | Norris & Landzberg, “Reliability of Controlled Collapse Interconnections”, IBM J. Res. Dev. 13, 1969 |
| Coffin-Manson | Plastic strain amplitude / temperature cycling | (Δε_p_use/Δε_p_stress)^n або (ΔT_use/ΔT_stress)^n | Low-cycle fatigue (solder joints, ductile metal), thermal expansion mismatch | L. F. Coffin, “A Study of the Effects of Cyclic Thermal Stresses…”, Trans. ASME 76, 1954; S. S. Manson, “Behaviour of Materials Under Conditions of Thermal Stress”, NACA Report 1170, 1954 |
Для e-самоката найважливіші: Arrhenius (BMS MCU NBTI, motor controller MOSFET TDDB, electrolytic capacitor dryout), Norris-Landzberg (solder joints на controller PCB при кожному heating/cooling cycle = 1 поїздка), Coffin-Manson (BMS cell-connection tabs при cell expansion/contraction), Inverse Power Law (Y-capacitor на EMI filter при line surge events).
Activation energy E_a для типових механізмів (per JEDEC JEP122H):
- Electromigration (Al / Cu interconnects): 0.5–0.9 eV
- Time-Dependent Dielectric Breakdown (TDDB): 0.6–0.9 eV
- Hot Carrier Injection (HCI): 0.2–0.4 eV (counterintuitively, lower T accelerates)
- NBTI (Negative Bias Temperature Instability): 0.2–0.5 eV
- Electrolytic capacitor dryout: 0.5–0.7 eV
- Solder fatigue (SnPb / SAC): ~0.123 eV (Norris-Landzberg)
- Aluminum corrosion: ~0.7 eV
Rule of thumb: 10°C збільшення температури при E_a = 0.7 eV дає AF ≈ 2 (правило подвоєння). Це й є фізична основа derating: працювати компонент на 25°C нижче max rating → подвоїти MTBF.
7. Parts-count vs parts-stress prediction workflow
MIL-HDBK-217F (як і інші reliability prediction handbooks) пропонує два methods of increasing precision:
Parts-count method (early design) — використовується коли детальна component-level stress data недоступна (concept stage):
λ_equip = Σᵢ Nᵢ · (λ_g,ᵢ · π_Q,ᵢ)
де Nᵢ — кількість компонентів типу i, λ_g,ᵢ — generic failure rate from MIL-HDBK-217F table, π_Q,ᵢ — quality factor (commercial / industrial / military / space).
Parts-stress method (detailed design) — коли є detailed stress data на кожен компонент:
λ_part = λ_b · π_T · π_S · π_E · π_Q · π_A · …
де λ_b — base failure rate, а π — multiplicative stress factors (Temperature, Stress, Environment, Quality, Application…).
Для типового e-самоката BLDC controller PCB (приклад):
| Компонент | N | λ_g (FIT) | π_Q | Sub-total FIT |
|---|---|---|---|---|
| MOSFET (power, 6×) | 6 | 50 | 1.0 (industrial) | 300 |
| Gate driver IC (3×) | 3 | 15 | 1.0 | 45 |
| MCU (1×) | 1 | 20 | 1.0 | 20 |
| Electrolytic capacitor (4×) | 4 | 200 | 1.0 | 800 |
| Ceramic capacitor (40×) | 40 | 0.3 | 1.0 | 12 |
| Resistor (60×) | 60 | 0.1 | 1.0 | 6 |
| Connector (3×) | 3 | 30 | 1.0 | 90 |
| Sum | 1 273 FIT |
MTBF = 10⁹ / 1 273 ≈ 785 000 годин ≈ 89 років continuous. Це prediction at reference conditions (25°C, no humidity, no shock). At actual use conditions (40–60°C average, vibration, daily thermal cycling) — multiply by environmental π_E (~5–10) → MTBF reduces до 8 000–18 000 годин (≈ 5–10 років duty-cycle-adjusted), що відповідає типовому warranty period e-самоката 2 роки.
8. Stress-strength interference + derating
Класична модель reliability: компонент має strength (capability to withstand stress) — random variable з distribution P(strength). Operating environment накладає stress — random variable з distribution P(stress). Failure відбувається коли stress > strength (interference region):
P(failure) = ∫₀^∞ f_stress(x) · F_strength(x) dx
Зменшити P(failure) можна трьома способами:
- Збільшити mean(strength) — обрати дорожчий компонент з вищим rating.
- Зменшити mean(stress) — derating (працювати на ≤ 50% rated).
- Зменшити σ(stress) або σ(strength) — quality control + screening.
Derating practices (industry standard per NASA EEE-INST-002, ECSS-Q-30-11):
| Компонент | Derating ratio (operating / rated) | Обґрунтування |
|---|---|---|
| Resistor power | ≤ 50% | Temperature rise + drift |
| Capacitor voltage | ≤ 50% (electrolytic), ≤ 80% (ceramic) | Dielectric stress + leakage |
| Diode forward current | ≤ 50% | Junction temperature |
| Power MOSFET V_DS | ≤ 80% | Avalanche safety margin |
| Power MOSFET I_D | ≤ 80% | RDS(on) thermal headroom |
| IC junction temperature | ≤ Tj_max − 25°C | Arrhenius doubling rule |
| Connector contact current | ≤ 75% | Contact resistance heating |
| Bearing dynamic load | ≤ C/P ≥ 4 (L10 > 30 000 год) | ISO 281 L10 life |
Для e-самоката найкритичніше: power MOSFETs у motor controller (continuous current при start/hill-climb наближається до 80% I_D rating → junction temperature наближається до 150°C → Arrhenius AF проти reference 75°C = 2^(75/10) ≈ 180× shorter MTBF). Тому industrial-grade controllers застосовують 2× MOSFET parallelization і active gate driver thermal monitoring.
9. Reliability Block Diagrams (RBD)
RBD — graphical representation of a system showing how subsystems combine to form overall reliability:
Series configuration — система працює лише якщо ВСІ компоненти працюють:
R_series(t) = R₁(t) · R₂(t) · … · Rₙ(t)
Для exponential розподілів: λ_series = λ₁ + λ₂ + … + λₙ. Кожен component зменшує загальну надійність — series is “weakest link” architecture.
Parallel (active redundancy) — система працює якщо хоча б ОДИН компонент працює:
R_parallel(t) = 1 − (1 − R₁(t)) · (1 − R₂(t)) · … · (1 − Rₙ(t))
Дві identical units (R₁ = R₂ = R) дають R_parallel = 2R − R². При R = 0.99 — R_parallel = 0.9999. Це дороге improvement (2× cost), тому застосовується лише для safety-critical paths.
k-out-of-n — система працює якщо принаймні k з n компонентів працюють. Binomial summation:
R_{k/n}(t) = Σ_{j=k}^{n} C(n,j) · R(t)^j · (1 − R(t))^{n−j}
Bridge network — non-decomposable topology, потребує either pivotal-decomposition method, або minimal-path/cut-set enumeration.
E-самокат як series-parallel RBD (спрощений):
Battery → BMS → [Controller A || Controller B (redundant)] → Motor → Wheel
\→ Charger (off-board, не у series during ride)
↓
[Lighting] — paralleled in safety path
У типовому e-самокаті немає redundancy на critical path (battery → BMS → controller → motor → wheel — usually single-channel). Це усвідомлений compromise: redundancy додає вагу + cost > value для personal mobility. Натомість надійність гарантується через derating + screening + ALT validation.
10. FMEA (MIL-STD-1629A → IEC 60812:2018)
FMEA (Failure Mode and Effects Analysis) — bottom-up systematic analysis: для кожного component → який можливий failure mode → який effect → яка severity / probability / detectability. Створено US DoD у MIL-STD-1629A (1980), розширено у MIL-STD-1629A Notice 3 (1998 → cancelled 1998 але de facto industry reference), формалізовано як IEC 60812:2018 (поточна редакція) і AIAG-VDA FMEA Handbook 2019 (automotive industry consensus, replaces SAE J1739).
Risk Priority Number (RPN) — multiplicative score:
RPN = Severity × Occurrence × Detection (each 1–10)
Mitigation prioritization за descending RPN. AIAG-VDA 2019 замінив RPN на Action Priority (AP) — three-tier classification (High / Medium / Low) на основі Severity-Occurrence-Detection table, що не каскадує mathematically (виправляє відомий defect старого RPN, де 5×5×5 = 125 і 10×5×2.5 = 125 — однаково, але дуже різні).
FMEA для e-самоката BMS (фрагмент, illustrative):
| Component | Failure mode | Effect | S | O | D | RPN |
|---|---|---|---|---|---|---|
| BMS MOSFET (charge gate) | Stuck-on (short) | Cannot disconnect → overcharge → thermal runaway | 10 | 3 | 5 | 150 |
| BMS MOSFET (charge gate) | Stuck-off (open) | Cannot charge → user complaint | 4 | 4 | 2 | 32 |
| Cell voltage sense wire | Open | Loss of monitoring → individual cell overvoltage possible | 9 | 5 | 4 | 180 |
| Temperature sensor (NTC) | Open | BMS reads −∞ → no thermal cutoff | 9 | 3 | 3 | 81 |
| Temperature sensor (NTC) | Short | BMS reads +∞ → false trip | 4 | 4 | 2 | 32 |
Найвищий RPN (cell voltage sense wire open, 180) → mitigation: redundant sense lines + plausibility check (compare summed cell voltages vs pack voltage measurement).
11. FTA (IEC 61025)
FTA (Fault Tree Analysis) — top-down deductive analysis: задано top event (наприклад: “Battery thermal runaway”), будуємо логічне дерево причин з AND/OR-воротами, що декомпозує до basic events (atomic component failures). Створено H.A. Watson у Bell Labs (1962, Minuteman ICBM safety analysis), formalized as IEC 61025:2006 (US analog NUREG-0492).
Minimal cut set — мінімальна комбінація basic events, що тригерить top event. Order of cut set = кількість basic events: order 1 = single point of failure, order ≥ 2 = redundancy exists.
FTA для top event “Thermal runaway” (фрагмент):
TOP: Battery thermal runaway
OR
├── Overcharge during charge cycle
│ AND
│ ├── BMS charge MOSFET stuck-on (basic event)
│ └── Charger overvoltage protection failure (basic event)
├── Internal short (cell-level)
│ OR
│ ├── Manufacturing defect (basic event)
│ ├── Mechanical damage (impact / vibration) (basic event)
│ └── Dendrite growth (overcharge / aging) (basic event)
├── External short
│ AND
│ ├── Insulation breach (basic event)
│ └── Both BMS discharge MOSFETs stuck-on (basic event)
└── Thermal abuse
OR
├── External heat source > 60°C (basic event)
└── Cooling failure + high discharge load (basic event)
Cut sets order 1 (single point of failure) — manufacturing defect, mechanical damage, dendrite growth, external heat. Cut sets order 2 — BMS + charger combined, insulation + both MOSFETs.
Quantitative FTA: підставляємо component failure probabilities → top-event probability через AND (multiply) / OR (sum для rare events). Якщо BMS MOSFET stuck-on = 10⁻⁴/year, charger overvoltage = 10⁻³/year → “Overcharge” subtree = 10⁻⁷/year (1 incident per 10 million scooters per year — acceptable per ISO 26262 ASIL-C SIL target).
12. FRACAS + DRBFM
FRACAS (Failure Reporting, Analysis, and Corrective Action System) — closed-loop process для виявлення повторюваних failure modes у field returns. Steps:
- Report: warranty claim → standardized failure ticket (component + symptom + serial + use conditions).
- Analyze: root cause analysis (5-Why, fishbone / Ishikawa, 8D problem solving).
- Corrective action: design change / supplier change / process change.
- Verify: pilot batch з fix → reduced failure rate confirmed.
- Close: documentation у master FMEA, оновлення design rules.
DRBFM (Design Review Based on Failure Mode) — Toyota practice (Shigeru Mizuno, 1996) для change reviews: при будь-якій зміні existing design, формальний review focuses тільки на зміни і їхні interaction з unchanged parts. Це дешевший ніж full FMEA-rebuild, але catch’ить regression bugs, що вводить change.
13. ALT / HALT / HASS — Hobbs method
ALT (Accelerated Life Test) — apply elevated stress to compress lifetime. Two protocols:
- Constant-stress ALT: 3+ samples at кожному з 3+ stress levels (constant during test) → fit Weibull-Arrhenius → extrapolate to use conditions. Strict statistical foundation, conservative (Nelson, Accelerated Testing, Wiley 1990).
- Step-stress ALT: same samples тестують at progressively higher stress steps. Faster but harder to analyze (Nelson cumulative damage model).
HALT (Highly Accelerated Life Test) — Gregg Hobbs technique (Accelerated Reliability Engineering: HALT and HASS, Wiley 2000). Не для quantitative MTBF — а для discovery of design weaknesses через step-stress to destruction:
- Cold step stress: −10°C every 10 min until non-operational → operating limit; продовжити до destruct.
- Hot step stress: +10°C every 10 min until non-operational; продовжити до destruct.
- Rapid thermal cycling: ±X°C/min ramp rate, capture intermediate failures.
- Vibration step stress: 5 G_rms increments to destruct.
- Combined: temperature + vibration + voltage simultaneously.
Output: operating limit (≥ specification + margin) і destruct limit (catastrophic stress level). Design changes посилюють weak points until operating margin > 50% above worst-case use conditions.
HASS (Highly Accelerated Stress Screening) — production-line screening на основі HALT-derived limits. Зазвичай 80% of operating limit, applied to every unit produced. Розрахований catch’ити фаза-1 infant mortality (manufacturing defects) without consuming healthy units’ useful life.
Для e-самоката HALT typically performed by tier-1 controller manufacturer (контролер motor / BMS PCB):
- Cold: −40°C (Arctic winter operation envelope).
- Hot: +85°C (motor controller compartment summer heat soak).
- Vibration: 30 G_rms random (road shock + curb-drop).
- Thermal cycling: −30°C ↔ +60°C × 100 cycles (storage + use).
- Voltage: ±20% rated battery voltage (low cell + full charge corners).
ESS (Environmental Stress Screening) — older term, often interchangeable з HASS. IEC 61163-1:2006 specifies ESS protocols.
14. Cross-axis matrix: reliability concepts по 27 попередніх axes
| Engineering axis | Reliability concept | Метрика | Acceleration model | Стандарт |
|---|---|---|---|---|
| Battery cell + BMS | Cycle life, calendar life | C/3 cycles to 80% SoH | Arrhenius (calendar) + cycle-throughput (Bazant) | IEC 62660-2, UL 1973 |
| Battery lifecycle | Second-life capability | RPT (Reference Performance Test) | Calendar + cycle combined | IEC 62902, ISO/IEC 12405-4 |
| Motor + controller | MOSFET TDDB, motor bearing | FIT (semiconductor), L10 (bearing) | Arrhenius + Eyring + Norris-Landzberg | JEDEC JEP122H, MIL-HDBK-217F |
| Brake system | Pad wear, hydraulic seal | mm/1000 km, leak rate | Inverse Power Law (load) | ECE R78, ISO 11157 |
| Suspension | Damper seal life, spring fatigue | leak/cycles, S-N curve | Coffin-Manson, IPL | DIN 53513, ISO 12131 |
| Tire | Tread depth, casing fatigue | mm/1000 km, TWI | IPL (load) + Arrhenius (rubber aging) | ISO 28580, UTQG |
| Lighting | LED L70/L80/L90 (lumen maintenance) | hours to 70%/80%/90% initial lumen | Arrhenius (junction T) | LM-80, TM-21 |
| Frame + fork | HCF (high-cycle fatigue) | S-N curve, endurance limit | Basquin’s law (S-N) | EN 17128, ISO 4210 |
| Display + HMI | LCD/OLED degradation | nits to 50%, dead-pixel count | Arrhenius + photon dose | IEC 62977 |
| Charger SMPS | Electrolytic capacitor dryout, MOSFET TDDB | FIT, ESR drift | Arrhenius (E_a ~0.7 eV) | IEC 62368-1, JEDEC |
| Connector + harness | Contact fretting, insulation aging | mΩ drift, IR drop | Arrhenius + Inverse Power Law | EIA-364-23, IEC 60512 |
| IP protection | Seal compression set | leak/cycles | Arrhenius (rubber) | ISO 815, IEC 60529 |
| Bearings (ISO 281 L10) | L10 dynamic life | million revolutions to 90% survival | Lundberg-Palmgren (a₁·a₂·a₃) | ISO 281, ISO 16281 |
| Stem + folding | Hinge wear, fold-cycle fatigue | cycles to failure | Coffin-Manson (low-cycle) | EN 17128 |
| Deck + footboard | Composite fatigue, surface wear | strain cycles, μ deg | Basquin, IPL | EN 17128 |
| Handgrip + lever + throttle | Polymer fatigue, hall-sensor drift | cycles, output drift | Coffin-Manson + Arrhenius | ISO 11421 |
| Wheel + rim + spoke | Spoke tension fatigue, rim corrosion | cycles, μm/year | S-N + Arrhenius | EN 17128, ASTM B117 |
| Fastener + bolted joint | Preload loss (embedment + relaxation) | %/cycles | Logarithmic (relaxation) | VDI 2230 |
| Thermal management | Cooling fan MTBF, TIM degradation | hours, °C·m²/W drift | Arrhenius (TIM) + IPL (fan) | JEDEC JESD51 |
| EMC/EMI | Y-capacitor degradation, choke insulation | μA leakage drift | Arrhenius + IPL (voltage) | IEC 60384-14, IEC 60938 |
| Cybersecurity | Cryptographic obsolescence (post-quantum migration) | years to algorithm sunset | (Non-statistical: planned per NIST PQC roadmap) | NIST FIPS 203/204/205 |
| NVH | Damping element aging | tan δ drift | Arrhenius (rubber) | ISO 6721 |
| Functional safety | PFD/PFH (safety integrity) | failures per demand / per hour | Constant-rate exponential | IEC 61508, ISO 26262 |
| Repair + reparability | MTTR (mean time to repair) | hours | Operational, not predicted | EN 45554 |
| Environmental robustness | Combined-stress aging | composite metric | Multi-stress Eyring | MIL-STD-810H, IEC 60068 |
| Privacy | Cryptographic key lifetime | years | (Non-statistical: per NIST SP 800-57 cryptoperiod) | NIST SP 800-57 |
| Helmet + protective gear | EPS foam aging, polycarbonate UV | years to brittleness | Arrhenius + photon dose | EN 1078, EN 17128 |
27 engineering axes + 1 reliability meta-axis (this article) = повний engineering corpus. Reliability як meta-axis надає уніфікований апарат для quantification усіх інших axes.
15. 8-step DIY owner reliability practices
Власник e-самоката не проводить ALT/HALT, але може подовжити фактичний MTBF через прості практики:
- Уникай thermal cycling extremes — не залишай scooter у +50°C сонячному boot під літом і не переходь з −20°C мороза одразу в +25°C приміщення (Norris-Landzberg solder fatigue: 70°C ΔT swing ~ 10× shorter solder joint life ніж 30°C swing).
- Зарядка при кімнатній температурі — Arrhenius rule: 10°C lower → 2× longer battery calendar life. Не заряджай після ride immediately (battery hot) — зачекай 30 хв.
- Storage SoC 40–60%, не 100% — Arrhenius + calendar fade залежать від voltage stress (Eyring); 100% SoC stored at 40°C втрачає 20% capacity за рік vs 50% SoC at 20°C — 2% за рік (IEC 62660-2 calendar test methodology).
- Не перевантажуй у sustained climb — power MOSFET I_D approaching rated I_D continuously → Tj near 150°C → Arrhenius doubling: 25°C Tj overshoot = 5× shorter MOSFET MTBF.
- Дощ + вібрація = Norris-Landzberg + corrosion — IP rating не безкінечний. Після кожної поїздки у дощ — wipe сухою тканиною, особливо connectors (EIA-364-23 fretting corrosion is voltage-accelerated).
- Stop bolted-joint loosening — preload loss (per VDI 2230 + fastener-axis) accelerates з vibration cycles. Перевіряй torque на критичних joints (stem, fork, axle) кожні 200 км.
- Field-return signal — патерн, не одинична подія — якщо два-три відмови того самого типу у короткий період → це не випадковість, а β > 1 wear-out або β < 1 batch defect. Звертайся до виробника з серійними номерами і датами відмов — реальний FRACAS input.
- Documentation of dates і кілометражу при кожній subsystem replacement — це твій personal warranty data. Через 3 роки, коли наступний defect з’явиться, у тебе буде Weibull-actionable data для negotiation з manufacturer.
16. Recap — 10 ключових тверджень
- Reliability engineering — meta-axis всіх 27 інших engineering-axes; вона надає quantitative apparatus (R(t), λ(t), MTBF, FIT) для прогнозу і валідації надійності кожної з них.
- Reliability ≠ functional safety ≠ maintenance — три різні axes: reliability питає “скільки до відмови?”, functional safety — “що при відмові?”, maintenance — “як відновити?”.
- Bathtub curve має три фази: infant mortality (β < 1, DFR), useful life (β ≈ 1, CFR), wear-out (β > 1, IFR). Інженерна ціль — посунути всю криву донизу і подовжити фазу 2.
- Розподіл Вейбулла (Waloddi Weibull 1951) — canonical reliability distribution: одним параметром β описує всі три фази bathtub.
- Standards corpus: MIL-HDBK-217F Notice 2 + IEC 61709:2017 + FIDES Guide 2009A + Telcordia SR-332 Issue 4 — чотири головні prediction methods (різні значення до 10× для тих самих компонентів; IEEE 1413 вимагає transparency).
- Acceleration models: Arrhenius (T), Eyring (T+other), Inverse Power Law (V), Norris-Landzberg (TC), Coffin-Manson (plastic strain) — фізична основа ALT testing і derating.
- Reliability Block Diagrams — series (multiply), parallel (1 − product of unreliabilities), k-out-of-n (binomial). E-самокат у більшості — series RBD без redundancy на critical path.
- FMEA + FTA + FRACAS + DRBFM — process toolset: FMEA (bottom-up, MIL-STD-1629A → IEC 60812:2018 → AIAG-VDA 2019), FTA (top-down, IEC 61025), FRACAS (closed-loop field returns), DRBFM (change-driven Toyota practice).
- HALT/HASS (Hobbs method) — qualitative discovery of design weak points через step-stress to destruct + production screening at 80% operating limit. Не ALT — ALT для quantitative MTBF, HALT для design hardening.
- DIY owner practices — derating через behavior: уникай thermal extremes, заряджай прохолодним, зберігай 40–60% SoC, не залишай sustained max-load, документуй subsystem replacement dates для personal Weibull dataset.
Інженерія надійності — двадцять восьма engineering axis і одинадцята cross-cutting infrastructure axis після privacy. Вона не існує як окремий “вузол” у scooter — це методологія, що накладається поверх кожної з 27 попередніх axes і дозволяє відповісти на питання, на яке кожна з них окремо лише натякає: скільки протримається ця підсистема при цих умовах експлуатації, і яким буде failure mode коли вона нарешті відмовить.