Disputation i elektronik med Isaac Sánchez Leal
Välkommen till disputation i elektronik där Isaac Sánchez Leal kommer att presentera sin doktorsavhandling om partitionering av djup neural nätverk för implementering på resursbegränsade IoT-enheter.
Datum: 18 februari 2026
Tid: 09:00
Plats: Campus Sundsvall, L-huset, sal L111 samt online via Youtube och Zoom.
Doktorsavhandling: "Partitioned Deep Neural Network Inference on Resource-Constrained IoT Devices: A System-Level Methodology"
Respondent: Isaac Sánchez Leal
Handledare och ordförande: Professor Mattias O'Nils, Mittuniversitetet
Medhandledare: Professor Faisal Qureshi, University of Ontario Institute of Technology, Canada
Opponent: Professor Johan Lilius, Åbo Akademi, Finland
Betygsnämnd:
Professor Ahmed Hemani, KTH
Docent Oscar Gustafsson, Linköpings universitet
Professor Francesco Bonavolontà, University of Naples
Reserv: Docent Johan Sidén, Mittuniversitetet
Sammanfattning
Utbredningen av Sakernas internet (IoT) har drivit på implementeringen av djupinlärningsmodeller på resursbegränsade kantenheter. Det finns dock en rundläggande konflikt mellan beräkningskraven för djupa neurala nätverk (DNNs) och de strikta energi- och bearbetningsgränserna hos batteridrivna noder. Även om intelligensuppdelning (intelligence partitioning) erbjuder en potentiell lösning genom att avlasta beräkningar till en server, hindras praktisk användning av de strukturella egenskaperna hos moderna DNNs, där dataexpansion i tidiga lager skapar en kritisk kommunikationsflaskhals. Denna avhandling föreslår ett ramverk för effektiv distribuerad intelligens som överbryggar klyftan mellan algoritmisk komplexitet och hårdvarubegränsningar.
Forskningen inleds med en systematisk analys av det ömsesidiga beroendet mellan bearbetning och kommunikation för att identifiera de styrande parametrar som dikterar systemets effektivitet. Baserat på denna analys introduceras en samdesignstrategi för att övervinna det strukturella motståndet mot uppdelning hos DNNs. Genom att synergistiskt kombinera transformationer på modell- och datanivå möjliggör metoden uppkomsten av effektiva uppdelningspunkter, vilket avsevärt minskar nodens energiåtgång och latens. Slutligen föreslår avhandlingen en mekanism för att frikoppla noggrannhetsvariabeln från effektivitetsbegränsningar. Detta uppnås genom introduktionen av en ny systemkomponent som fungerar som en generativ modell, vilket skiftar paradigmet från informationsbevarande till rekonstruktion. Detta säkerställer att precisionen bibehålls även vid strikt optimering.
Sammanfattningsvis etablerar denna avhandling en systematisk metodik för effektiv uppdelning av DNNs. Den visar att identifiering av kärnvariablerna i samspelet mellan bearbetning och kommunikation möjliggör implementering av riktade optimeringsstrategier. Dessa åtgärder underlättar en effektiv avlastning av beräkningsbördan för att utnyttja kapaciteten hos obegränsade servrar, vilket maximerar nodens effektivitet utan att kompromissa med noggrannheten.
Läs hela avhandlingen