RIASSUNTO NEWSLETTER TECNOLOGICHE
AI E MACHINE LEARNING
Ottimizzare l'inferenza con modelli GGUF quantizzati
- I modelli GGUF sono il formato più usato per inferenze LLM locali grazie a compattezza e integrazione con tool come llama.cpp e ollama. Tuttavia, sono modelli quantizzati (da 16-bit a 8-, 4- o 2-bit), con possibile perdita di qualità in alcuni contesti come lunghe sequenze o input multilingue. L'articolo dimostra che le impostazioni di inferenza standard (temperature, top-p) spesso non sono ottimali per modelli quantizzati, specie a bassi bit (es. 2-bit Q2_K) che risultano molto sensibili a questi iperparametri. Sono stati testati 300 set di hyperparametri su modelli Qwen3 con varie quantizzazioni (AWQ, bitsandbytes 4-bit, GGUF 2/4-bit) usando vLLM e valutazioni IFEval.
- https://kaitchup.substack.com/p/using-gguf-models-optimize-your-inference
Studio MIT su come usare ChatGPT influisce sul cervello umano
- Ricerca che coinvolge 54 studenti suddivisi in 3 gruppi (uso ChatGPT, uso motore di ricerca, nessuno strumento AI) per valutare come l'uso di AI generativa per scrivere saggi impatti sulle funzioni cerebrali e cognitive.
- Risultati chiave: l'uso di ChatGPT riduce l'attività cerebrale nelle aree di pianificazione e memoria, chi usa AI ricorda meno e produce testi più uniformi ma meno originali. Chi smette di usare ChatGPT dopo averlo impiegato presenta difficoltà a scrivere in modo autonomo, con un fenomeno chiamato "debito cognitivo".
- Lo studio sottolinea l'importanza di una formazione adeguata per usare l’AI come supporto senza perdere capacità critiche.
- https://arxiv.org/pdf/2506.08872
AI Agents: progresso verso agenti autonomi e multi-modali
- Diverse ricerche mostrano agenti AI che coordinano sotto-agenti specializzati (architettura gerarchica), apprendono nel tempo tramite memoria persistente, usano strumenti esterni e integrano input multi-modali, aumentando autonomia e flessibilità.
- Tecniche di distillazione senza training consentono modelli piccoli di emulare agenti complessi, rendendo l'autonomia più accessibile.
- https://www.llmwatch.com/p/ai-agents-of-the-week-papers-you
Nuovo aggiornamento di Mistral Small 3.2
- Mistral Small versione 3.2 migliora follow instructions, riduce ripetizioni infinite e rende più robusta la chiamata a funzioni. Il modello è progettato per inferenza efficiente con struttura wide-and-shallow ed eccelle su benchmark ampi.
- https://kaitchup.substack.com/p/the-weekly-kaitchup-98
SVILUPPO SOFTWARE E AUTOMAZIONE DEVOPS
Pipeline AI di Airbnb per migrare test React da Enzyme a React Testing Library
- Airbnb ha automatizzato una migrazione complessa di 3500+ test React originariamente basati su Enzyme verso React Testing Library, passando da una stima di 18 mesi a 6 settimane di lavoro con 6 ingegneri.
- La strategia si basa su pipeline modulare per file con passaggi validati singolarmente (refactor Enzyme, fix Jest, lint/TypeScript), supportata da LLM che ricevono feedback dinamici e contesto esteso per rigenerare codice nei casi complessi. Il sistema usa annotazioni di stato e ripetizioni mirate per migliorare gradualmente la qualità.
- Il progetto ha mantenuto intenti e coverage dei test, realizzando una significativa riduzione di tempo e sforzo manuale, aprendo la strada a simili automazioni su larga scala.
- https://blog.bytebytego.com/p/inside-airbnbs-ai-powered-pipeline
RAG vs Agentic RAG: due approcci alla generazione aumentata da retrieval
- RAG (Retrieval Augmented Generation) combina recupero informazioni da database vettoriali con LLM per risposte, ma ha capacità limitate di adattamento e aggiornamenti.
- Agentic RAG aggiunge agent AI autonomi che possono formulare strategie di ricerca, selezionare strumenti, memorizzare contesto a breve e lungo termine, migliorando flessibilità e accuratezza, particolarmente su dati dinamici o multi-sorgente.
- https://blog.bytebytego.com/p/ep169-rag-vs-agentic-rag
Raccolta di risorse per lo sviluppo con AI agents
- Repository GitHub che raccoglie le migliori app open-source basate su LLM, utili per apprendere idee creative e tecniche relative a sinergie tra agent AI, retrieval-augmented generation (RAG) e knowledge processing (MCP, RAG).
- https://github.com/Shubhamsaboo/awesome-llm-apps
Nuovo libro Object Oriented Design Interview disponibile
- Libro con framework a 4 step per risolvere domande di design orientato agli oggetti, 11 casi reali con soluzioni, 133 diagrammi dettagliati. Disponibile su Amazon e in versione digitale prossimamente.
- https://blog.bytebytego.com/p/object-oriented-design-interview
DATABASE E INFRASTRUTTURE
Database indexing: tipi di indici e casi d'uso
- L’indicizzazione nei database riduce la scansione completa facilitando ricerche rapide. Diverse tipologie di indice (B-tree, Hash, Bitmap, ecc.) ottimizzano tipi specifici di query ma comportano costi in scrittura e spazio. Comprendere quando e come usarli è cruciale per performance e scalabilità.
- https://blog.bytebytego.com/p/database-indexing-demystified-index
Guida veloce a Kubernetes
- Kubernetes orchestra container applicativi su cluster tramite controllo centrale e nodi worker. Risorse chiave includono Pods (contenitori raggruppati), Deployments, Services e Persistent Volumes. L’autoscaling orizzontale adatta il numero di pod in base a metriche come CPU e memoria.
- https://blog.bytebytego.com/p/ep169-rag-vs-agentic-rag (sezione Kubernetes)
BUSINESS TECNOLOGICO E MERCATO
Adozione delle app IA in Italia – dati esclusivi
- ChatGPT è l’app IA generativa più usata in Italia con 8,8 milioni di utenti mensili (20.7% della popolazione 18-74 anni online) ad aprile 2025, crescendo rapidamente negli ultimi 12 mesi (+266%). Seguono Google Gemini (
2,8M), Microsoft Copilot (2,7M) e altre app come Deepseek, Perplexity, Claude e Grok. - Demograficamente, uso trasversale ma maggiore tra giovani 18-24 per ChatGPT. Applicazioni creative audio, immagini e video guidano con utenti da decine a centinaia di migliaia.
- https://vincos.substack.com/p/le-app-di-ia-piu-usate-in-italia
Investimenti e innovazione a Milano
- Ecosistema innovazione dati e algoritmi a Milano sta crescendo fortemente, rappresentando quasi metà dell’ecosistema italiano complessivo. Cluster fintech e life science si consolidano, e cresce la presenza di investitori stranieri.
- Yes Milano Innovation Map offre dati aggiornati su startup, investitori e round finanziari.
- https://substack.com/redirect/2810fd07-0554-480d-9cb1-5c6833ebbb98
Startup e grandi nomi del settore IA e tecnologia
- Apple valuta acquisizione di Perplexity, Meta ha trattative per Thinking Machines, mentre Mira Murati ha raccolto 2 miliardi con Thinking Machines Lab. Tesla ha lanciato robotaxi a Austin.
- https://www.reuters.com/business/apple-executives-held-internal-talks-about-buying-perplexity-bloomberg-news-2025-06-20
- https://techcrunch.com/2025/06/20/mira-muratis-thinking-machines-lab-closes-on-2b-at-10b-valuation/
- https://www.theverge.com/news/690846/tesla-robotaxi-first-reaction-austin
- https://www.theverge.com/command-line-newsletter/690720/meta-buy-thinking-machines-perplexity-safe-superintelligence
FORMAZIONE E RISORSE PROFESSIONALI
Ruoli aperti nel settore tecnologico e AI
- Posizioni aperte tra cui Junior UX/UI Designer, Senior Process Analyst, Java Backend Developer, Senior Frontend Developer, vari ruoli di Machine Learning Engineer in aziende come THRON, Goglio, ION Group, Able Tech, Snap Inc., Roblox, Meta.
- https://jobs.datapizza.tech/opportunities
Guida all'uso di Claude Code
- Video formativo passo passo per utilizzare in modo efficiente Claude Code, con spiegazioni sui comandi e esempi pratici.
- https://www.youtube.com/watch?v=Cxd4b5JYqKE
Evoluzione del software: le 3 ere secondo Andrej Karpathy
- Software 1.0: istruzioni passo passo codificate.
- Software 2.0: apprendimento da esempi su reti neurali.
- Software 3.0: uso di prompt in linguaggio naturale per far funzionare le AI.
- https://www.youtube.com/watch?v=LCEmiRjPEtQ
TENDENZE DELLA SETTIMANA
- Quantizzazione dei modelli LLM: GGUF confermato come formato leader, con AWQ in forte ascesa grazie a robustezza e facilità d'uso. Crescente attenzione all'ottimizzazione degli iperparametri per i modelli molto quantizzati (2-4 bit). Prossima diffusione di FP4 a livello hardware e software entro il 2026.
- AI come supporto cognitivo e rischi associati: studi emergenti evidenziano riduzione di sforzo mentale e memoria con l’uso di AI come ChatGPT, portando al dibattito su "debito cognitivo" e necessità di formazione nell'uso responsabile.
- Automazione DevOps con AI avanzata: l'adozione di LLM per trasformazioni massive di codice e test, con pipeline strutturate e feedback dinamici, accelera enormemente task complessi.
- Evoluzione degli agenti AI: sviluppo verso agenti gerarchici con memoria persistente e controllo autonomo su strumenti esterni, promettendo agenti davvero autonomi e adattivi.
- Diffusione e adozione IA in Italia: forte crescita nell’uso di chatbot generativi e app creative, con profilazione demografica chiara e crescente penetrazione nel lavoro e formazione.
- Formazione e nuova cultura del software: passaggio dai codici rigidamente scritti a modelli che apprendono da dati e prompt naturali, con l'esigenza di competenze specializzate nel refactoring, architettura e automazione.
- Investimenti tecnologici e innovazione locale: Milano si conferma hub cruciale in Italia, con eccellenze in fintech e life science e attrazione di capitali internazionali.
Questo mix di innovazioni tecniche, impatti cognitivi, automazioni intelligenti e mercati in evoluzione descrive il panorama attuale e futuro dell'ecosistema tecnologico e AI.
Ti potrebbe anche interessare
Riassunto Newsletter Tech: AI, Sistemi Distribuiti, Sviluppo & Tendenze
RIASSUNTO NEWSLETTER TECNOLOGICHE DISTRIBUTED SYSTEMS Lati Oscuri dei Sistemi Distribuiti:...
Newsletter Tech: AI, GPT-4.5, Strategie Business, LinkedIn e Tendenze Digitali
RIASSUNTO NEWSLETTER TECNOLOGICHE AI e Machine Learning TransMLA: miglioramento di...
AI, Sviluppo Software e Trend Tech: Riassunto Newsletter con Llama 4, ChatGPT e Molto Altro
RIASSUNTO NEWSLETTER TECNOLOGICHE AI e Machine Learning DeepSeek-GRM: miglioramento dei...