Fin de vie

06/2016 : depuis plusieurs mois, les logs se remplissent d'erreurs sur la communication SATA, j'ai changé les nappes, intervertit les connecteurs, essayé différentes options de noyau pour abaisser la vitesse du bus mais rien à faire :'( .

[83368.466693] ata3.00: exception Emask 0x10 SAct 0x0 SErr 0x400000 action 0x6 frozen
[83368.466739] ata3.00: irq_stat 0x08000000, interface fatal error
[83368.466765] ata3: SError: { Handshk }
[83368.466789] ata3.00: failed command: WRITE DMA EXT
[83368.466820] ata3.00: cmd 35/00:e8:ff:5a:4c/00:01:1f:00:00/e0 tag 4 dma 249856 out
[83368.466823]          res 50/00:00:fe:5a:4c/00:00:1f:00:00/e0 Emask 0x10 (ATA bus error)
[83368.466889] ata3.00: status: { DRDY }
[83368.466917] ata3: hard resetting link
[83368.784115] ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
[83368.785584] ata3.00: configured for UDMA/100
[83368.785609] ata3: EH complete

L'USB est également devenu instable, de nombreuses erreurs noyaux sont loguées et finissent pas bloquer Popeye :

[508921.204450] pin.pl          D f3ff8f74     0  1807   1790 0x00000000
[508921.204460]  f3ff8d50 00200082 c102e5dc f3ff8f74 00000000 00000000 c102d2b9 c1484ac0
[508921.204475]  f3ff8f00 c1484ac0 f3ff8d50 c12c4721 b9cb27bb 0001ce3e 0001ce3e f4274470
[508921.204490]  0001ce3e c1484ac0 f3ff8f04 c1484ac0 00000000 002744a4 f79c0ac0 f79c0ac0
[508921.204505] Call Trace:
[508921.204513]  [<c102e5dc>] ? pick_next_task_fair+0xa5/0xad
[508921.204522]  [<c102d2b9>] ? finish_task_switch+0x6d/0x94
[508921.204530]  [<c12c4721>] ? __schedule+0x594/0x5a4
[508921.204538]  [<c102adde>] ? test_tsk_need_resched+0xa/0x13
[508921.204547]  [<c12c4eab>] ? __mutex_lock_common.isra.5+0xdd/0x12d
[508921.204555]  [<c12c4dc2>] ? mutex_lock+0x15/0x21
[508921.204565]  [<f89265c0>] ? acm_write_bulk+0x5a/0x5a [cdc_acm]
[508921.204574]  [<c11d5af2>] ? tty_port_close_start+0xec/0x149
[508921.204584]  [<f892773c>] ? acm_tty_close+0x2a/0x7b [cdc_acm]
[508921.204592]  [<c11d030a>] ? tty_release+0x169/0x3f7a
[508921.204600]  [<c102d2b9>] ? finish_task_switch+0x6d/0x94
[508921.204608]  [<c12c4721>] ? __schedule+0x594/0x5a4
[508921.204615]  [<c12c8674>] ? do_page_fault+0x32f/0x35e
[508921.204625]  [<c10ced03>] ? fput+0xd5/0x160
[508921.204634]  [<c10ccb18>] ? filp_close+0x52/0x58
[508921.204641]  [<c10ccb74>] ? sys_close+0x56/0x89
[508921.204649]  [<c12c9fdf>] ? sysenter_do_call+0x12/0x12

Cela se traduit par un blocage des processus utilisant l'USB, une augmentation du load et finalement une pénurie de ressources. J'ai atteint un load de 35 en 24h avec une charge CPU à ~0 et impossible de se connecter en ssh :dead: .

Augmentation du load à cause du blocage de l'USB

02/2018 : après 7 ans de bon et loyaux service ma carte double tuner TNT a rendu l'âme. Elle présentait déjà des signes de faiblesse depuis 2 ans car le changement de fréquence ne s'effectuait plus correctement : il fallait donner l'ordre 2 fois. A ce titre, j'avais modifié et recompilé le backend de Mythtv pour ajouter un double changement de fréquence.

La fin de vie de cette carte a provoqué des plantages du noyau avec une augmentation du nombre de process bloqué sur des ressources USB, j'ai eu un load de 164 :dead:. J'ai mis quelques temps à comprendre d'où ça venait…

Load de 164...