Точното разпознаване на изображения отдавна е една сериозна цел пред изкуствения интелект. Още през 2016 г. Google споделиха, че техният AI има това умение и може да го прилага с 94% точност. Но сега от Microsoft споделят, че са стигнали много по-напред и тяхната изградена AI система е по-точна и от човек, и дори се предлага в Azure Cognitive Services, така че разработчиците да могат да я прилагат в своите приложения.
“Описанието под изображението е един от най-трудните проблеми в AI,” казва Ерик Бойд, CVP на Azure AI, в интервю за Engadget. “Това представлява не само разбиране на обектите в дадена сцена, но и как те взаимодействат и как това да бъде описано”. Подобряването и усъвършенстването на техниките за т.нар. кепшънинг, може да помогне на всеки потребител да намира по-лесно изображението, което търси, в дадения енджин. Отделно, за потребителите с увредено зрение, системата може да направи навигацията в мрежата и софтуера значително по-добра.
Не е необичайно за компаниите да рекламират своите изследователски иновации в областта на изкуствения интелект, но сякаш бързото им внедряване в продукти се случва по-сложно. Това е и причината, поради която Ксуедонг Хуанг, главният технически директор на Azure AI Cognitive Services, настоява за бърза интеграция, тъй като вярва, че системата може да донесе до много ползи на потребителите. Екипът на Хуанг е обучил модела с изображения, маркирани с тагове от ключови думи, което помага за създаването на визуален език, какъвто повечето AI фреймуъркове нямат. По-стандартен метод е тези видове модели да се обучават с изображения с пълно описание, но това пречи на научаването как взаимодействат конкретни обекти.
“Тази предварителна подготовка на визуален речник е необходимото образование за една система и ние се опитваме да я обучим на моторна памет,” казва Хуанг. Новата създадена AI система от Microsoft, към момента се счита за водеща в т.нар. nocaps (no caption) изображения. Това, което следва е, да видим как този AI се справя в истинския свят и как ще отговорят конкурентите от Google и други компании.