Tech Newsletter: AI, Sviluppo, Innovazione e Mercato della Settimana

RIASSUNTO NEWSLETTER TECNOLOGICHE

AI E MACHINE LEARNING

Ottimizzare l'inferenza con modelli GGUF quantizzati

I modelli GGUF sono il formato più usato per inferenze LLM locali grazie a compattezza e integrazione con tool come llama.cpp e ollama. Tuttavia, sono modelli quantizzati (da 16-bit a 8-, 4- o 2-bit), con possibile perdita di qualità in alcuni contesti come lunghe sequenze o input multilingue. L'articolo dimostra che le impostazioni di inferenza standard (temperature, top-p) spesso non sono ottimali per modelli quantizzati, specie a bassi bit (es. 2-bit Q2_K) che risultano molto sensibili a questi iperparametri. Sono stati testati 300 set di hyperparametri su modelli Qwen3 con varie quantizzazioni (AWQ, bitsandbytes 4-bit, GGUF 2/4-bit) usando vLLM e valutazioni IFEval.
https://kaitchup.substack.com/p/using-gguf-models-optimize-your-inference

Studio MIT su come usare ChatGPT influisce sul cervello umano

Ricerca che coinvolge 54 studenti suddivisi in 3 gruppi (uso ChatGPT, uso motore di ricerca, nessuno strumento AI) per valutare come l'uso di AI generativa per scrivere saggi impatti sulle funzioni cerebrali e cognitive.
Risultati chiave: l'uso di ChatGPT riduce l'attività cerebrale nelle aree di pianificazione e memoria, chi usa AI ricorda meno e produce testi più uniformi ma meno originali. Chi smette di usare ChatGPT dopo averlo impiegato presenta difficoltà a scrivere in modo autonomo, con un fenomeno chiamato "debito cognitivo".
Lo studio sottolinea l'importanza di una formazione adeguata per usare l’AI come supporto senza perdere capacità critiche.
https://arxiv.org/pdf/2506.08872

AI Agents: progresso verso agenti autonomi e multi-modali

Diverse ricerche mostrano agenti AI che coordinano sotto-agenti specializzati (architettura gerarchica), apprendono nel tempo tramite memoria persistente, usano strumenti esterni e integrano input multi-modali, aumentando autonomia e flessibilità.
Tecniche di distillazione senza training consentono modelli piccoli di emulare agenti complessi, rendendo l'autonomia più accessibile.
https://www.llmwatch.com/p/ai-agents-of-the-week-papers-you

Nuovo aggiornamento di Mistral Small 3.2

Mistral Small versione 3.2 migliora follow instructions, riduce ripetizioni infinite e rende più robusta la chiamata a funzioni. Il modello è progettato per inferenza efficiente con struttura wide-and-shallow ed eccelle su benchmark ampi.
https://kaitchup.substack.com/p/the-weekly-kaitchup-98

SVILUPPO SOFTWARE E AUTOMAZIONE DEVOPS

Pipeline AI di Airbnb per migrare test React da Enzyme a React Testing Library

Airbnb ha automatizzato una migrazione complessa di 3500+ test React originariamente basati su Enzyme verso React Testing Library, passando da una stima di 18 mesi a 6 settimane di lavoro con 6 ingegneri.
La strategia si basa su pipeline modulare per file con passaggi validati singolarmente (refactor Enzyme, fix Jest, lint/TypeScript), supportata da LLM che ricevono feedback dinamici e contesto esteso per rigenerare codice nei casi complessi. Il sistema usa annotazioni di stato e ripetizioni mirate per migliorare gradualmente la qualità.
Il progetto ha mantenuto intenti e coverage dei test, realizzando una significativa riduzione di tempo e sforzo manuale, aprendo la strada a simili automazioni su larga scala.
https://blog.bytebytego.com/p/inside-airbnbs-ai-powered-pipeline

RAG vs Agentic RAG: due approcci alla generazione aumentata da retrieval

RAG (Retrieval Augmented Generation) combina recupero informazioni da database vettoriali con LLM per risposte, ma ha capacità limitate di adattamento e aggiornamenti.
Agentic RAG aggiunge agent AI autonomi che possono formulare strategie di ricerca, selezionare strumenti, memorizzare contesto a breve e lungo termine, migliorando flessibilità e accuratezza, particolarmente su dati dinamici o multi-sorgente.
https://blog.bytebytego.com/p/ep169-rag-vs-agentic-rag

Raccolta di risorse per lo sviluppo con AI agents

Repository GitHub che raccoglie le migliori app open-source basate su LLM, utili per apprendere idee creative e tecniche relative a sinergie tra agent AI, retrieval-augmented generation (RAG) e knowledge processing (MCP, RAG).
https://github.com/Shubhamsaboo/awesome-llm-apps

Nuovo libro Object Oriented Design Interview disponibile

Libro con framework a 4 step per risolvere domande di design orientato agli oggetti, 11 casi reali con soluzioni, 133 diagrammi dettagliati. Disponibile su Amazon e in versione digitale prossimamente.
https://blog.bytebytego.com/p/object-oriented-design-interview

DATABASE E INFRASTRUTTURE

Database indexing: tipi di indici e casi d'uso

L’indicizzazione nei database riduce la scansione completa facilitando ricerche rapide. Diverse tipologie di indice (B-tree, Hash, Bitmap, ecc.) ottimizzano tipi specifici di query ma comportano costi in scrittura e spazio. Comprendere quando e come usarli è cruciale per performance e scalabilità.
https://blog.bytebytego.com/p/database-indexing-demystified-index

Guida veloce a Kubernetes

Kubernetes orchestra container applicativi su cluster tramite controllo centrale e nodi worker. Risorse chiave includono Pods (contenitori raggruppati), Deployments, Services e Persistent Volumes. L’autoscaling orizzontale adatta il numero di pod in base a metriche come CPU e memoria.
https://blog.bytebytego.com/p/ep169-rag-vs-agentic-rag (sezione Kubernetes)

BUSINESS TECNOLOGICO E MERCATO

Adozione delle app IA in Italia – dati esclusivi

ChatGPT è l’app IA generativa più usata in Italia con 8,8 milioni di utenti mensili (20.7% della popolazione 18-74 anni online) ad aprile 2025, crescendo rapidamente negli ultimi 12 mesi (+266%). Seguono Google Gemini (~~2,8M), Microsoft Copilot (~~2,7M) e altre app come Deepseek, Perplexity, Claude e Grok.
Demograficamente, uso trasversale ma maggiore tra giovani 18-24 per ChatGPT. Applicazioni creative audio, immagini e video guidano con utenti da decine a centinaia di migliaia.
https://vincos.substack.com/p/le-app-di-ia-piu-usate-in-italia

Investimenti e innovazione a Milano

Ecosistema innovazione dati e algoritmi a Milano sta crescendo fortemente, rappresentando quasi metà dell’ecosistema italiano complessivo. Cluster fintech e life science si consolidano, e cresce la presenza di investitori stranieri.
Yes Milano Innovation Map offre dati aggiornati su startup, investitori e round finanziari.
https://substack.com/redirect/2810fd07-0554-480d-9cb1-5c6833ebbb98

Startup e grandi nomi del settore IA e tecnologia

Apple valuta acquisizione di Perplexity, Meta ha trattative per Thinking Machines, mentre Mira Murati ha raccolto 2 miliardi con Thinking Machines Lab. Tesla ha lanciato robotaxi a Austin.
https://www.reuters.com/business/apple-executives-held-internal-talks-about-buying-perplexity-bloomberg-news-2025-06-20
https://techcrunch.com/2025/06/20/mira-muratis-thinking-machines-lab-closes-on-2b-at-10b-valuation/
https://www.theverge.com/news/690846/tesla-robotaxi-first-reaction-austin
https://www.theverge.com/command-line-newsletter/690720/meta-buy-thinking-machines-perplexity-safe-superintelligence

FORMAZIONE E RISORSE PROFESSIONALI

Ruoli aperti nel settore tecnologico e AI

Posizioni aperte tra cui Junior UX/UI Designer, Senior Process Analyst, Java Backend Developer, Senior Frontend Developer, vari ruoli di Machine Learning Engineer in aziende come THRON, Goglio, ION Group, Able Tech, Snap Inc., Roblox, Meta.
https://jobs.datapizza.tech/opportunities

Guida all'uso di Claude Code

Video formativo passo passo per utilizzare in modo efficiente Claude Code, con spiegazioni sui comandi e esempi pratici.
https://www.youtube.com/watch?v=Cxd4b5JYqKE

Evoluzione del software: le 3 ere secondo Andrej Karpathy

Software 1.0: istruzioni passo passo codificate.
Software 2.0: apprendimento da esempi su reti neurali.
Software 3.0: uso di prompt in linguaggio naturale per far funzionare le AI.
https://www.youtube.com/watch?v=LCEmiRjPEtQ

TENDENZE DELLA SETTIMANA

Quantizzazione dei modelli LLM: GGUF confermato come formato leader, con AWQ in forte ascesa grazie a robustezza e facilità d'uso. Crescente attenzione all'ottimizzazione degli iperparametri per i modelli molto quantizzati (2-4 bit). Prossima diffusione di FP4 a livello hardware e software entro il 2026.
AI come supporto cognitivo e rischi associati: studi emergenti evidenziano riduzione di sforzo mentale e memoria con l’uso di AI come ChatGPT, portando al dibattito su "debito cognitivo" e necessità di formazione nell'uso responsabile.
Automazione DevOps con AI avanzata: l'adozione di LLM per trasformazioni massive di codice e test, con pipeline strutturate e feedback dinamici, accelera enormemente task complessi.
Evoluzione degli agenti AI: sviluppo verso agenti gerarchici con memoria persistente e controllo autonomo su strumenti esterni, promettendo agenti davvero autonomi e adattivi.
Diffusione e adozione IA in Italia: forte crescita nell’uso di chatbot generativi e app creative, con profilazione demografica chiara e crescente penetrazione nel lavoro e formazione.
Formazione e nuova cultura del software: passaggio dai codici rigidamente scritti a modelli che apprendono da dati e prompt naturali, con l'esigenza di competenze specializzate nel refactoring, architettura e automazione.
Investimenti tecnologici e innovazione locale: Milano si conferma hub cruciale in Italia, con eccellenze in fintech e life science e attrazione di capitali internazionali.

Questo mix di innovazioni tecniche, impatti cognitivi, automazioni intelligenti e mercati in evoluzione descrive il panorama attuale e futuro dell'ecosistema tecnologico e AI.