Versione: 3.0.0-alpha (Diátaxis)

Risoluzione dei problemi — Redis

Perdita di dati dopo il riavvio

Causa: la storageClass utilizzata e local, il che significa che i dati sono archiviati unicamente sul nodo fisico dove veniva eseguito il pod. Se il pod viene ripianificato su un altro nodo, i dati precedenti vengono persi.

Soluzione:

Verificate la storageClass utilizzata:
```
kubectl get pvc -l app=redis-<name>
```
Se usate una sola replica (replicas = 1), passate a storageClass: replicated affinche lo storage compensi l'assenza di replica applicativa. Se avete più repliche (replicas >= 3), storageClass: local e appropriato perché Redis Sentinel assicura già l'alta disponibilità:
redis.yaml
```
spec:
  storageClass: replicated    # Se replicas = 1
  # storageClass: local       # Se replicas >= 3 (Sentinel assicura l'HA)
```
Applicate la modifica. Notate che un cambio di storageClass richiede generalmente la ricreazione dei PVC.
Assicuratevi anche che replicas >= 3 per beneficiare della replica Redis Sentinel.

Redis Sentinel non converge

Causa: il numero di repliche è pari o inferiore a 3, il che impedisce al quorum Sentinel di funzionare correttamente. Sentinel necessità di una maggioranza per eleggere un nuovo primary.

Soluzione:

Verificate il numero di repliche:
```
kubectl get pods -l app=redis-<name>
```
Assicuratevi di usare un numero dispari >= 3:
redis.yaml
```
spec:
  replicas: 3    # Oppure 5, mai 2 o 4
```
Consultate i log di Sentinel per identificare i problemi di convergenza:
```
kubectl logs -l app=rfs-redis-<name>
```
Verificate la connettività di rete tra i pod Redis. Problemi di DNS o di rete possono impedire la scoperta dei nodi.

Memoria satura (OOMKilled)

Causa: il dataset Redis supera la memoria allocata al contenitore. Kubernetes termina il pod quando supera il suo limite di memoria.

Soluzione:

Verificate se il pod è stato terminato per OOM:

kubectl describe pod rfr-redis-<name>-0 | grep -i oom

Aumentate la memoria allocata tramite resources.memory o un resourcesPreset superiore:
redis.yaml
```
spec:
  resources:
    cpu: 1000m
    memory: 2Gi    # Aumentare la memoria
```
Verificate la politica di eviction Redis (maxmemory-policy). Per impostazione predefinita, Redis restituisce un errore quando la memoria e piena. Considerate l'uso di allkeys-lru se Redis funge da cache.

Monitorate la dimensione del dataset:

redis-cli -h rfr-redis-<name> -p 6379 -a <password> INFO memory

Timeout di connessione

Causa: i pod Redis non sono in esecuzione, gli endpoint del servizio sono vuoti, o la configurazione di autenticazione lato client non corrisponde a quella del server.

Soluzione:

Verificate che i pod siano nello stato Running:
```
kubectl get pods -l app=redis-<name>
```

Verificate che i servizi abbiano endpoint:

kubectl get endpoints rfr-redis-<name>
kubectl get endpoints rfs-redis-<name>

Se authEnabled: true, assicuratevi che il vostro client fornisca la password corretta.

Testate la connessione da un pod di debug:

kubectl run test-redis --rm -it --image=redis:7 -- redis-cli -h rfr-redis-<name> -p 6379 -a <password> PING

Autenticazione fallita

Causa: la password utilizzata non corrisponde a quella memorizzata nel Secret Kubernetes, oppure authEnabled non è attivato sul server mentre il client invia una password (o viceversa).

Soluzione:

Recuperate la password corretta dal Secret:

kubectl get tenantsecret redis-<name>-auth -o jsonpath='{.data.password}' | base64 -d

Verificate che authEnabled: true sia configurato nel vostro manifesto:
redis.yaml
```
spec:
  authEnabled: true
```
Assicuratevi che il vostro client utilizzi esattamente la password recuperata al passo 1.
Se avete cambiato la configurazione authEnabled, i client esistenti devono essere aggiornati per riflettere il cambiamento.

Perdita di dati dopo il riavvio​

Redis Sentinel non converge​

Memoria satura (OOMKilled)​

Timeout di connessione​

Autenticazione fallita​

Perdita di dati dopo il riavvio

Redis Sentinel non converge

Memoria satura (OOMKilled)

Timeout di connessione

Autenticazione fallita