זמן קריאה: 2 דקות

במסגרת אירוע Search On 2020 הכריזו אנשי גוגל כי עד סוף חודש אוקטובר 2020 אמור להיכנס לפעילות אלגוריתם חדש לבדיקת איות (Spelling). הנושא חשוב ביותר, מאחר ולדברי אנשי גוגל, 1 מתוך כל 10 חיפושים כולל בתוכו שגיאת איוט.

על פי דברי גוגל, מדובר באלגוריתם העושה למידה עמוקה (Deep Learning) באמצעות רשת עצבית עמוקה (Deep Neural Network או בקיצור DNN).

אנשי גוגל אומרים כי מדובר בשיפור משמעותי ביותר, שיהיה גדול מכל השיפורים שהוכנסו לאלגוריתם האיות בחמש השנים האחרונות ביחד. לא יודע מה זה אומר בפועל, אבל זה בהחלט נשמע מרשים.

מה זה בכלל רשת עצבית עמוקה?

<< אמ;לק >> רשת עצבית עמוקה היא רשת של צמתי החלטה המסודרת בשכבות מרובות. מטרת הרשת היא לזהות את המסלול הנכון ביותר שיש לעבור בין הצמתים (או בעצם מהי סדרת ההחלטות הנכונה ביותר בין הצמתים) כדי להגיע מן הקלט אל הפלט. המידע נקלט ברשת, עובר בין השכבות, ולבסוף מתקבלת הסתברות לכל פלט אפשרי. כל צומת החלטה מתמטי כזה נחשב לשכבה, וכאשר יש ריבוי צמתים (ריבוי שכבות), אז הרשת מוגדרת כרשת "עמוקה".<< אמ;לק >>

אז איך יפעל האלגוריתם החדש?

האלגוריתם החדש עושה שימוש במעל 680 מיליון פרמטרים (צמתים) כדי לחשב את המילה בעלת ההסתברות הגבוהה ביותר להיות המילה הנכונה. בהחלט כמות שתגדיר את הרשת כ-"עמוקה". עומק הרשת אמור לאפשר טיפול גם בשגיאות כתיב מאד (אבל מאד) קיצוניות.

הרשת תדע לנתח גם את ההקשר בו מופיעה המילה בכדי להגדיל את הסיכוי למצוא את האיות הנכון. באמצעות ניתוח ההקשר היא גם תוכל לזהות מילים בהן האיות נראה נכון, אך הוא לא האיות של המילה אליה הגולש התכוון. אגב, לדעתי כאן נמצא החידוש המשמעותי ביותר באלגוריתם החדש!