Deep Dive Tech: Amazon Key, HTTP/3 e Ottimizzazione AI

RIASSUNTO NEWSLETTER TECNOLOGICHE

TECNOLOGIE DI ACCESSO E LOGISTICA: AMAZON KEY

Come Amazon Key apre 100 milioni di porte ogni anno
- Amazon Key nasce per risolvere un problema comune nella logistica urbana: i ritardi nelle consegne causati da sistemi di controllo accessi inaccessibili a corrieri in aree residenziali o commerciali con accesso controllato, come condomini o gated communities. Lanciato nel 2018, il sistema permette ai corrieri Amazon autorizzati di sbloccare porte e cancelli al momento giusto e solo per il tempo necessario alla consegna, garantendo sicurezza e affidabilità.
- Il progetto ha avuto origine nel 2016 da un’idea di Kaushik Mani, con un dispositivo universale connesso al cloud. Dopo un primo pivot da parcheggi a consegne "last mile", ha iniziato con un sistema basato su hardware Ethernet e backend serverless usando AWS Lambda. Con l’espansione globale, sono stati superati molti ostacoli tecnici: limitazioni hardware dovute allo spazio e connessioni di rete difficili, prestazioni limitate della soluzione Lambda (soprattutto cold start Java), e mancanza di feedback in tempo reale per i corrieri.
- La soluzione è evoluta verso dispositivi cellulari multi-carrier per una connettività affidabile ovunque e un backend containerizzato su Amazon ECS Fargate per garantire bassa latenza e scalabilità globale. Si è adottata un’architettura a microservizi ben definita per gestire provisioning, controllo accessi, manutenzione e interfacce con partner esterni come Grubhub, ora integrati tramite un sistema di API sicure e autenticazione mTLS.
- Un sistema intelligente di gestione della connettività (Intelligent Connection Manager) monitora le condizioni di rete cellulari e automatizza azioni correttive (reboot, cambio rete, ecc.) per mantenere alta disponibilità e affidabilità.
- Risultati chiave: oltre 100 milioni di sblocchi annuali, miglioramento delle consegne al primo tentativo, riduzione delle problematiche per edificio, e un’architettura pronta per espansioni future e integrazioni partner.
- Principali lezioni: evolvere l’architettura con la scala, usare metriche rilevanti legate al business, progettare per condizioni reali di campo, e scegliere tecnologie in base alle necessità specifiche senza aderire rigidamente a un paradigma.
- Fonte: https://blog.bytebytego.com/p/how-amazon-key-opens-100-million

PROTOCOLLI DI RETE E INTERNET

Analisi profonda di HTTP: dall’HTTP/1 all’HTTP/3
- HTTP è il protocollo fondamentale per la comunicazione su internet, usato da browser, app API, microservizi e infrastrutture come CDN e proxy. Evolvendosi da HTTP/1.0 a HTTP/3, si sono affrontati problemi di prestazioni dovuti ai limiti di TCP, come il "head-of-line blocking" e la gestione inefficiente delle connessioni.
- HTTP/1.1 ha reso HTTP scalabile, HTTP/2 ha introdotto il multiplexing su singola connessione TCP, e HTTP/3, basato su QUIC sopra UDP, mira a risolvere i limiti storici offrendo connessioni criptate, più velocità e ottimizzazione per dispositivi mobili.
- L’articolo spiega come funziona ogni versione, le caratteristiche chiave come compressione degli header, server push e riuso della connessione, e i casi di utilizzo ideali di HTTP/3, mantenendo una visione critica su problemi ancora aperti.
- Fonte: https://blog.bytebytego.com/p/a-deep-dive-into-http-from-http-1

AI E OTTIMIZZAZIONE DEI MODELLI LARGE LANGUAGE

Padding-Free vs. Packing: strategie di batching per il fine tuning di grandi modelli linguistici
- Nel fine tuning supervisionato di grandi modelli linguistici (LLM), il batching delle sequenze di input può usare diverse strategie per uniformare lunghezze: il padding (aggiungere token di riempimento a sequenze più corte) e il packing (accorpare multiple sequenze all’interno di un batch per massimizzare l’utilizzo).
- Il padding è semplice ma inefficiente in termini di memoria e calcolo, mentre il packing può velocizzare significativamente l’allenamento ma è più complesso da gestire e può compromettere la qualità se non implementato correttamente.
- Hugging Face ha introdotto una terza strategia chiamata “padding-free” che elimina gli sprechi di padding e supera i compromessi del packing, accelerando l’allenamento con minimi svantaggi.
- L’articolo approfondisce come queste strategie influenzano la dinamica di apprendimento, fornendo raccomandazioni sull’uso di packing soprattutto per pre-training continuato, mentre padding-free risulta più adatto per tuning general-purpose.
- Fonte: https://kaitchup.substack.com/p/padding-free-vs-packing-fast-and

TENDENZE DELLA SETTIMANA

Scalabilità e affidabilità globale nei sistemi distribuiti: il caso Amazon Key mostra l’importanza di ripensare hardware e software per garantire prestazioni costanti e operazioni in ambienti reali con vincoli complessi, come la connettività variabile e limiti fisici.
Migrazione da architetture serverless a containerizzate per workload a bassa latenza e stato persistente: la combinazione di ECS Fargate e microservizi emerge come soluzione preferita per bilanciare controllo, scalabilità e costi, rispetto all’uso esclusivo di Lambda.
Ottimizzazione delle risorse in AI con nuove tecniche di batching (padding-free) per ridurre sprechi computazionali al fine tuning di modelli di grandi dimensioni, segnando un passo avanti nell’efficienza dell’allenamento.
Evoluzione dei protocolli internet verso HTTP/3 e QUIC, che migliorano la velocità, sicurezza e affidabilità nelle comunicazioni web, critiche per lo sviluppo di applicazioni moderne e servizi cloud.

Questo riassunto fornisce una panoramica delle innovazioni recenti in ambito tecnologico e ingegneristico, evidenziando come l’integrazione di hardware, software e infrastrutture cloud sia cruciale per abilitare esperienze utente fluide e scalabili a livello mondiale.