Новата версия поставя акцент върху логическото мислене, контекстуалното разбиране и автономното програмиране
Google представи Gemini 2.5, най-напредналия си изкуствен интелект до момента, отбелязвайки значителен пробив в способностите на AI с подобрено логическо мислене и висока ефективност при решаването на сложни задачи. Моделът, пуснат днес в експериментална версия като Gemini 2.5 Pro, вече оглавява индустриалните класации и е достъпен в Google AI Studio и приложението Gemini за потребители с Advanced достъп.
Новият модел дебютира директно на първо място в класацията LMArena
Определян като „мислещ модел“, Gemini 2.5 е проектиран така, че първо да анализира проблема, преди да предложи отговор — способност, която значително повишава точността, контекстуалното разбиране и качеството на вземаните решения. За разлика от по-старите версии, които залагаха основно на разпознаване на шаблони и прогнози, този модел акцентира върху логически анализ, нюансирано тълкуване и информиран избор.
„Вграждаме тези мисловни способности във всичките си бъдещи модели“,
обявиха от Google при представянето.
„Така нашият AI може да решава по-сложни проблеми и да бъде основа за по-умни, контекстуално осъзнати агенти.“
Новият модел дебютира директно на първо място в класацията LMArena, която се базира на предпочитанията на потребители, благодарение на отличното си представяне в логическо мислене, програмиране и стилова последователност. Той показва отлични резултати и при тестове по математика и природни науки, включително GPQA и AIME 2025, без да разчита на скъпи техники като гласуване по време на изпълнение.
Особено впечатляващо е, че Gemini 2.5 Pro постига водещ резултат от 18.8% в Humanity’s Last Exam — изключително труден тест, създаден от стотици експерти, за да провери дали един AI може да мисли на човешко ниво в различни дисциплини.
Gemini 2.5 Pro постига водещ резултат от 18.8% в Humanity’s Last Exam
В областта на програмирането, Gemini 2.5 Pro бележи сериозен напредък спрямо предишната версия, Gemini 2.0. Той се отличава в създаването на функционални и визуално привлекателни уеб приложения, трансформиране на код чрез агентни подходи и редактиране на съществуващ код. Моделът е лидер и в SWE-Bench Verified — стандартът за оценка на AI, способен на автономно програмиране, като постига 63.8% при използване на персонализирана агентна конфигурация.
Като демонстрация на възможностите му, Google показа пример, в който Gemini 2.5 Pro генерира напълно функциониращо видео игрално приложение само от един ред промпт — демонстрирайки огромния му потенциал за разработчици, преподаватели и творци.
Цената за Gemini 2.5 Pro ще бъде обявена в близките седмици, като ще се предлагат опции с по-високи лимити и мащабна употреба в производствени среди. Моделът скоро ще бъде наличен и в Vertex AI.