Versione: 3.0.0-alpha (Diátaxis)

Concetti — Kubernetes

Architettura

Lo schema seguente illustra la struttura e le interazioni principali del cluster Kubernetes Hikube, includendo l'alta disponibilità del piano di controllo, la gestione dei nodi, la persistenza dei dati e la replica inter-regioni.

Componenti principali del cluster

Etcd Cluster

Contiene diverse istanze di etcd replicate tra loro.
Garantisce la coerenza dell'archiviazione dello stato del cluster Kubernetes (informazioni su pod, servizi, configurazioni, ecc.).
La replica interna tra i nodi etcd garantisce la tolleranza ai guasti.

Control Plane

Composto dall'API Server, dallo Scheduler e dal Controller Manager.
Ruolo:
- Pianifica i workload (pod, deployment, ecc.) sui nodi disponibili.
- Interagisce con etcd per leggere/scrivere lo stato del cluster.

Node Groups

Ogni gruppo contiene diversi nodi di lavoro (worker nodes).
I workload (pod) vengono distribuiti su questi nodi.
I nodi comunicano con il Control Plane per ricevere i loro compiti.
Leggono e scrivono i loro dati nei Persistent Volume (PV) Kubernetes.

Kubernetes PV Data

Rappresenta l'archiviazione persistente utilizzata dai pod.
I dati dei workload vengono scritti e letti da questa archiviazione.
Questo livello è integrato nella replica Hikube per garantire la disponibilità dei dati.

Livello di replica Hikube

Hikube Replication Data Layer

Funge da interfaccia tra Kubernetes e i sistemi di archiviazione regionali.
Replica automaticamente i dati dei PV verso diverse regioni per:
- l'alta disponibilità,
- la resilienza ai guasti regionali,
- e la continuità del servizio.

Archiviazioni regionali

Region 1 → Geneva Data Storage
Region 2 → Gland Data Storage
Region 3 → Lucerne Data Storage

Ogni regione dispone del proprio backend di archiviazione, tutti sincronizzati tramite il livello Hikube.

Flussi di comunicazione

I nodi etcd si sincronizzano tra loro per mantenere uno stato globale coerente.
Il Control Plane legge/scrive in etcd per memorizzare lo stato del cluster.
Il Control Plane pianifica i workload sui Node Groups.
I Node Groups interagiscono con i PV Kubernetes per archiviare o recuperare dati.
I PV Data vengono replicati attraverso l'Hikube Replication Data Layer verso le 3 regioni.

Riepilogo funzionale

Livello	Funzione principale	Tecnologia
Etcd Cluster	Archiviazione dello stato del cluster	etcd
Control Plane	Gestione e pianificazione dei workload	Kubernetes
Node Groups	Esecuzione dei workload	kubelet, container runtime
PV Data	Archiviazione persistente	Kubernetes Persistent Volumes
Hikube Data Layer	Replica e sincronizzazione multi-regione	Hikube
Data Storage	Archiviazione fisica regionale	Geneva / Gland / Lucerne

Obiettivo globale

Questa architettura garantisce:

Alta disponibilità del cluster Kubernetes.
Resilienza geografica grazie alla replica inter-regioni.
Integrita dei dati tramite etcd e l'archiviazione persistente.
Scalabilita orizzontale con i Node Groups.

Control Plane

Il campo controlPlane definisce la configurazione del piano di controllo del cluster Kubernetes gestito. Specifica le risorse allocate a ciascun componente chiave (API Server, Scheduler, Controller Manager, Konnectivity) e il numero di repliche per l'alta disponibilità.

control-plane.yaml
controlPlane:
  apiServer:
    resources:
      cpu: 2
      memory: 4Gi
    resourcesPreset: small
  controllerManager:
    resources:
      cpu: 2
      memory: 2Gi
    resourcesPreset: small
  konnectivity:
    server:
      resources:
        cpu: 1
        memory: 1Gi
      resourcesPreset: nano
  scheduler:
    resources:
      cpu: 1
      memory: 512Mi
    resourcesPreset: micro
  replicas: 3

`apiServer` (Object)

L'apiServer e il componente centrale del piano di controllo Kubernetes. Gestisce tutte le richieste verso l'API Kubernetes e garantisce la comunicazione tra i componenti interni del cluster.

Campo	Tipo	Obbligatorio	Descrizione
`resources`	Object	Si	Definisce le risorse CPU e memoria allocate all'API Server
`resources.cpu`	string	No	Numero di vCPU attribuiti (es: `2`)
`resources.memory`	string	No	Quantita di memoria allocata (es: `4Gi`)
`resourcesPreset`	string	Si	Profilo di risorse predefinito (`nano`, `micro`, `small`, `medium`, `large`, `xlarge`, `2xlarge`)

`controllerManager` (Object)

Il controllerManager esegue i loop di controllo Kubernetes (reconciliation loops). Garantisce la creazione, l'aggiornamento e l'eliminazione delle risorse (pod, servizi, ecc.) in base allo stato desiderato del cluster.

Campo	Tipo	Obbligatorio	Descrizione
`resources`	Object	Si	Specifica le risorse CPU/memoria per il Controller Manager
`resources.cpu`	string	No	Numero di vCPU riservati
`resources.memory`	string	No	Quantita di memoria allocata
`resourcesPreset`	string	Si	Dimensione predefinita (`nano`, `micro`, `small`, `medium`, ecc.)

`konnectivity` (Object)

Il servizio Konnectivity gestisce la comunicazione sicura tra il piano di controllo e i nodi (agenti). Sostituisce il vecchio kube-proxy per le connessioni in uscita dei nodi e ottimizza la connettività di rete.

Campo	Tipo	Obbligatorio	Descrizione
`server.resources`	Object	Si	Specifica le risorse CPU/memoria del server Konnectivity
`server.resources.cpu`	string	No	Numero di vCPU
`server.resources.memory`	string	No	Quantita di memoria
`server.resourcesPreset`	string	Si	Profilo predefinito (`nano`, `micro`, `small`, `medium`, ecc.)

`scheduler` (Object)

Lo scheduler determina su quale nodo ogni pod deve essere eseguito in base ai vincoli di risorse, affinita e topologie.

Campo	Tipo	Obbligatorio	Descrizione
`resources`	Object	Si	Definisce le risorse allocate allo Scheduler
`resources.cpu`	string	No	Numero di vCPU
`resources.memory`	string	No	Quantita di memoria
`resourcesPreset`	string	Si	Dimensione predefinita (`nano`, `micro`, `small`, `medium`, ecc.)

`replicas` (integer)

Il campo replicas definisce il numero di istanze del piano di controllo. Un numero dispari di repliche (generalmente 3) è raccomandato per garantire l'alta disponibilità e il quorum in etcd.

Tipi di resourcesPreset

resourcesPreset: "nano"     # 0.1 CPU, 128 MiB RAM
resourcesPreset: "micro"    # 0.25 CPU, 256 MiB RAM
resourcesPreset: "small"    # 0.5 CPU, 512 MiB RAM
resourcesPreset: "medium"   # 0.5 CPU, 1 GiB RAM
resourcesPreset: "large"    # 1 CPU, 2 GiB RAM
resourcesPreset: "xlarge"   # 2 CPU, 4 GiB RAM
resourcesPreset: "2xlarge"  # 4 CPU, 8 GiB RAM

Buone pratiche Control Plane

Definire sempre replicas: 3 per la ridondanza.
Utilizzare resourcesPreset coerenti tra i componenti.
Adattare le risorse in base al carico (cluster di produzione → medium o large).
Non sottodimensionare apiServer, e il componente più sollecitato.

Node Groups

Il campo nodeGroup definisce la configurazione di un gruppo di nodi (worker) all'interno del cluster Kubernetes. Permette di specificare il tipo di istanza, le risorse, il numero di repliche, nonche i ruoli e le GPU associate.

node-group.yaml
nodeGroup:
  <name>:
    ephemeralStorage:
      size: 100Gi
    gpus:
      - name: nvidia.com/AD102GL_L40S
    instanceType: m5.large
    maxReplicas: 5
    minReplicas: 2
    resources:
      cpu: 4
      memory: 16Gi
    roles:
      - ingress-nginx

`ephemeralStorage` (Object)

Definisce la configurazione dell'archiviazione effimera associata ai nodi del gruppo. Questa archiviazione e utilizzata per dati temporanei, cache o file di log.

`gpus` (Array)

Elenca le GPU disponibili sui nodi del gruppo, utilizzate per carichi di lavoro che richiedono potenza di calcolo (IA, ML, ecc.).

Campo	Tipo	Obbligatorio	Descrizione
`name`	string	Si	Nome della GPU o tipo di scheda (`nvidia.com/AD102GL_L40S` o `nvidia.com/GA100_A100_PCIE_80GB`)

`instanceType` (string)

Specifica il tipo di istanza utilizzato per i nodi.

Serie S (Standard) — Rapporto 1:2

Ottimizzata per workload generali con CPU condivisa e burstable.

instanceType: "s1.small"     # 1 vCPU, 2 GB RAM
instanceType: "s1.medium"    # 2 vCPU, 4 GB RAM
instanceType: "s1.large"     # 4 vCPU, 8 GB RAM
instanceType: "s1.xlarge"    # 8 vCPU, 16 GB RAM
instanceType: "s1.3large"    # 12 vCPU, 24 GB RAM
instanceType: "s1.2xlarge"   # 16 vCPU, 32 GB RAM
instanceType: "s1.3xlarge"   # 24 vCPU, 48 GB RAM
instanceType: "s1.4xlarge"   # 32 vCPU, 64 GB RAM
instanceType: "s1.8xlarge"   # 64 vCPU, 128 GB RAM

Serie U (Universal) — Rapporto 1:4

Ottimizzata per workload bilanciati con più memoria.

instanceType: "u1.medium"    # 1 vCPU, 4 GB RAM
instanceType: "u1.large"     # 2 vCPU, 8 GB RAM
instanceType: "u1.xlarge"    # 4 vCPU, 16 GB RAM
instanceType: "u1.2xlarge"   # 8 vCPU, 32 GB RAM
instanceType: "u1.4xlarge"   # 16 vCPU, 64 GB RAM
instanceType: "u1.8xlarge"   # 32 vCPU, 128 GB RAM

Serie M (Memory Optimized) — Rapporto 1:8

Ottimizzata per applicazioni che richiedono molta memoria.

instanceType: "m1.large"     # 2 vCPU, 16 GB RAM
instanceType: "m1.xlarge"    # 4 vCPU, 32 GB RAM
instanceType: "m1.2xlarge"   # 8 vCPU, 64 GB RAM
instanceType: "m1.4xlarge"   # 16 vCPU, 128 GB RAM
instanceType: "m1.8xlarge"   # 32 vCPU, 256 GB RAM

`maxReplicas` / `minReplicas` (integer)

maxReplicas: numero massimo di nodi che possono essere distribuiti (limita l'autoscaling).
minReplicas: numero minimo di nodi garantiti in questo gruppo.

`resources` (Object)

Definisce le risorse allocate a ciascun nodo del gruppo (CPU e memoria).

Campo	Tipo	Obbligatorio	Descrizione
`cpu`	string	No	Numero di vCPU attribuiti per nodo (es: `4`)
`memory`	string	No	Quantita di memoria allocata per nodo (es: `16Gi`)

`roles` (Array)

Elenca i ruoli assegnati ai nodi del gruppo (es: ingress-nginx).

Esempi di Node Groups

Node Group Generale

node-group-general.yaml
nodeGroups:
  general:
    minReplicas: 2
    maxReplicas: 10
    instanceType: "s1.large"
    ephemeralStorage: 50Gi
    roles:
      - ingress-nginx

Node Group Compute Intensivo

node-group-compute.yaml
nodeGroups:
  compute:
    minReplicas: 0
    maxReplicas: 5
    instanceType: "u1.4xlarge"  # 16 vCPU, 64 GB RAM
    ephemeralStorage: 100Gi
    roles: []

Node Group Memory Optimized

node-group-memory.yaml
nodeGroups:
  memory-intensive:
    minReplicas: 1
    maxReplicas: 3
    instanceType: "m1.xlarge"   # 4 vCPU, 32 GB RAM
    ephemeralStorage: 30Gi
    resources:
      cpu: "6"       # Override: 6 vCPU invece di 4
      memory: "48Gi" # Override: 48 GB invece di 32

Buone pratiche Node Groups

Regolare minReplicas e maxReplicas in base alle esigenze di scalabilità.
Utilizzare instanceType coerenti con il carico di lavoro.
Definire un'archiviazione effimera sufficiente per i carichi temporanei (log, cache).
Specificare chiaramente i ruoli per segmentare le funzioni dei nodi (es: separazione worker / ingress).

Architettura​

Componenti principali del cluster​

Etcd Cluster​

Control Plane​

Node Groups​

Kubernetes PV Data​

Livello di replica Hikube​

Hikube Replication Data Layer​

Archiviazioni regionali​

Flussi di comunicazione​

Riepilogo funzionale​

Obiettivo globale​

Control Plane​

apiServer (Object)​

controllerManager (Object)​

konnectivity (Object)​

scheduler (Object)​

replicas (integer)​

Tipi di resourcesPreset​

Node Groups​

ephemeralStorage (Object)​

gpus (Array)​

instanceType (string)​

Serie S (Standard) — Rapporto 1:2​

Serie U (Universal) — Rapporto 1:4​

Serie M (Memory Optimized) — Rapporto 1:8​

maxReplicas / minReplicas (integer)​

resources (Object)​

roles (Array)​

Esempi di Node Groups​

Node Group Generale​

Node Group Compute Intensivo​

Node Group Memory Optimized​

Architettura

Componenti principali del cluster

Etcd Cluster

Control Plane

Node Groups

Kubernetes PV Data

Livello di replica Hikube

Hikube Replication Data Layer

Archiviazioni regionali

Flussi di comunicazione

Riepilogo funzionale

Obiettivo globale

Control Plane

`apiServer` (Object)

`controllerManager` (Object)

`konnectivity` (Object)

`scheduler` (Object)

`replicas` (integer)

Tipi di resourcesPreset

Node Groups

`ephemeralStorage` (Object)

`gpus` (Array)

`instanceType` (string)

Serie S (Standard) — Rapporto 1:2

Serie U (Universal) — Rapporto 1:4

Serie M (Memory Optimized) — Rapporto 1:8

`maxReplicas` / `minReplicas` (integer)

`resources` (Object)

`roles` (Array)

Esempi di Node Groups

Node Group Generale

Node Group Compute Intensivo

Node Group Memory Optimized