За първи път в 36-годишната история на Международната конференция за компютърно зрение – ICCV, български институт участва с 5 приети статии
Институтът INSAIT към Софийския университет „Св. Климент Охридски“ направи втори исторически пробив на световен форум в сферата на изкуствения интелект в рамките на месец. Тази седмица INSAIT участва с 5 приети статии в Международната конференция за компютърно зрение – ICCV, един от водещите световни технологични форуми, който се провежда от 2-ри до 6-ти октомври в Париж. Така за първи път в 36-годишната история на ICCV на нея участва българска институция.
Компютърното зрение е стратегическа област с очаквана пазарна стойност от 60 милиарда долара до 2030. Българският успех на ICCV се случва броени дни след като учени от института бяха поканени да представят 7 доклада на конференция номер 1 в света за изкуствен интелект - NeurIPS.
Разработките на учените от българския институт INSAIT на ICCV са в изключително конкурентни сфери и с реално практическо приложение. Сред тях са теми като автономни коли, наблюдение и сигурност, виртуална реалност, моделиране на човешки образи и други.
През 2022 INSAIТ успя да привлече в екипа си проф. Люк Ван Гуул, един от водещите световни учени в компютърното зрение. С него в София работят редица силни млади изследователи в тази област. Един от тях - Сам Мотамед, напуска най-силния световен университет за компютърни науки в света - Карнеги-Мелън, САЩ, за да е докторант в България. Не по-малко интересна е и историята на д-р Данда Паудел, който заменя най-силния европейски технологичен университет - ETH Zurich, за да работи в София, в института INSAIT към Софийския университет.
Сред петте публикации на ICCV е „Source-free Depth for Object Pop-out“. В нея се предлага нов метод за откриване на маскирани обекти, които са трудни за идентифициране дори от хора, с приложения в сферата на наблюдението и сигурността. В друг от докладите – „Improving Online Lane Graph Extraction by Object-Lane Clustering“, се представя метод, който помага на самоуправляващите се автомобили да разбират по-добре заобикалящата ги среда. Той използва 3D данни за подобряване на способността на автомобила да разпознава пътища и обекти, което го прави по-безопасен и надежден за автономно шофиране. В статията „Deformable Neural Radiance Fields using RGB and Event Cameras“ се предлага нов начин за заснемане на сложни динамични форми като огън и вода, с помощта на биотехнологични камери, с приложения в редица сфери, например виртуалната реалност. В материала „Surface Normal Clustering for Implicit Representation of Manhattan Scenes“ е изследван нов метод за създаване на 3D модели и изображения на сгради и затворени пространства. Последната статия предлага нов подход за изобразяване на лица, който запазва идентичността и подобрява качеството на специфичните за лицето детайли. Тя носи името “PATMAT: Person Aware Tuning of Mask-Aware Transformer for Face Inpainting”.