Yi‑Hsin Li ny doktor i Datateknik

Fre 13 feb. 2026 08:30

Nyligen presenterade Yi-Hsin Li framgågsrikt hennes avhandling "Steered Mixture of Experts for Compact and Edge-aware Representation: From 2D Image Regression to 3D Radiance Fields"

Yi-Hsin Li

Disputationen ägde rum vid Tekniska universitetet i Berlin och via Zoom. Handledare och ordförande för disputationen var professor Mårten Sjöström, Mittuniversitetet, och professor Thomas Sikora, Tekniska universitetet i Berlin. Examinationsnämnden bestod av professor Thomas Sikora, Tekniska universitetet i Berlin, professor Ulf Assarsson, Chalmers tekniska högskola, och professor Peter Lambert, Ghent University. 

Om avhandlingen

Visual computing kräver allt mer detaljerade men ändå effektiva representationer. Samtidigt fastnar 2D-modeller i rigida rutnät och många 3D-metoder blir realistiska först till priset av långa träningstider och höga resurskrav. Den här avhandlingen adresserar därför en central fråga: hur skapar man skalbara, högkvalitativa visuella representationer utan att offra effektivitet?

Avhandlingen fokuserar på Steered Mixture-of-Experts (SMoE), en modulär arkitektur med lokala kärnor och god tolkningsbarhet, men som länge plågats av tung träning, stora modeller och begränsat stöd för högdimensionella data. Arbetet besvarar tre frågor som syftar till att göra SMoE snabb, kompakt och användbar i 3D.

Först introduceras en segmenteringsbaserad initiering som alignerar experter med semantiska bildregioner, vilket minskar redundans och kraftigt förkortar träningen. Därefter ersätter avhandlingen ineffektiv gradientoptimering med ett rasteriserat träningsschema inspirerat av Gaussian splatting: bilder delas i block och endast relevanta kärnor aktiveras, vilket sänker beräkningskostnaden markant utan att tappa precision. Slutligen generaliseras SMoE till 3D genom omparameteriserade kärnor och differentiell rendering, vilket möjliggör kompakta och högkvalitativa scenuppbyggnader även vid gles data.

Experimentella resultat visar tydliga förbättringar i hastighet och rekonstruktionskvalitet jämfört med tidigare SMoE-modeller och konkurrerande 3D-metoder. Sammantaget gör dessa bidrag SMoE till ett praktiskt ramverk för effektiv och högfidel visuell representation och pekar mot bredare principer för strukturmedvetna, rasteriseringsvänliga lärsystem.

Läs hela avhandlingen här 


Sidan uppdaterades 2026-02-13