25 април, 2024

Любопитството на хората е безкрайно. Google обработва милиарди търсения всеки ден като 15% от тях са уникални. Когато хората отиват в търсачката, не винаги са сигурни в най-добрия начин да си формулират заявката. Не винаги знаем правилните думи, които да използваме или как се изписва дадено нещо, защото често пъти използваме търсене с цел да научим – не е задължително да имаме знанията предварително.

Работата на търсачката е да разбере какво търсите и да намери полезна информация от мрежата, независимо как пишете или комбинирате думите в заявката си. Въпреки че през годините се наблюдават подобрения при разбирането на езици, все още се наблюдават трудности, особено при сложни или разговорни заявки. Всъщност, това е една от причините, поради които хората често използват „ключови думи“, които помагат за търсенето, но всъщност нямат нищо общо с начина, по който реално се задават въпроси.

Миналата година от Google представиха технология за обработка на естествен език (Natural Language Processing), наречена BERT (Bidirectional Encoder Representations from Transformers). Тази технология позволява на всеки да обучи собствена система, която да отговаря на въпроси.

Този пробив беше резултат от изследванията на Google върху модели, които обработват думите спрямо всички останали думи в изречението, а не просто една по една подред. Моделите на BERT използват целия контекст на думата, като разглеждат думите преди и след нея. Това е особено полезно, за да се разбере намерението зад заявките за търсене.

Но това не е просто напредък в софтуера, който прави това възможно. Има нужда и от нов хардуер. Някои от моделите, които могат да се изградят с BERT, са толкова сложни, че минават границите на това, което може да се прави с традиционен хардуер.

Това са много технически подробности, но какво означава всичко това за вас? Като се прилагат BERT модели при Search, търсачката може да свърши много по-добра работа и да намира полезна информация. В действителност, BERT помага на Search услугата да разбере по-добре 1 от 10 търсения в на английски език като в последствие това ще се пренесе и на повече езици.

Особено за по-дълги, по-разговорни заявки или търсения, при които предлози като „за“ и „да“ имат голямо значение за смисъла, Търсенето ще може да разбере контекста на думите във вашата заявка. Можете да търсите по начин, който да ви се струва естествен.

Също така BERT може да подобри търсенето за хората от целия свят. Една от характеристиките на тази система е, че знанията от един език може да се приложат и за други. Могат да се вземат модели, които се учат от английски език (езикът на по-голямата част от уеб съдържанието) и да се приложат към други езици. Това ще подобри съответните резултати на много други езици, на които може да се търси.

Без значение какво търсите или на какъв език говорите, може да пробвате да пропуснете някои от ключовите думи и да търсите по начин, който ви се струва по-естествен. Все още ще се спъвате Google от време на време, но с времето ще се подобрява. Все пак разбирането на езици си остава предизвикателство.

Тагове: , , , , ,