זמן קריאה: 2 דקות

מישל דור מ-Ynet פרסם קישור לסרטון מרתק מבית מיקרוסופט המציג שתי טכנולוגיות לעיבוד והצגה של תמונות. אני רוצה לדבר דווקא על הטכנולוגיה השנייה, שנקראת PhotoSynth.

הטכנולוגיה, בפשטות, מאפשרת לקשר בין מספר רב של תמונות של אותו האובייקט, וליצור מאותן תמונות מודל תלת מימדי של האובייקט. הסרטון מדגים באופן חזותי בדיוק איך זה עובד.

דור נותן את דעתו לגבי השלכות הטכנולוגיה הזו, בכך שיתאפשר בעתיד ליצור מביליוני התמונות באינטרנט מודל תלת מימדי של העולם. בפוטנציה, אם כך, בנוסף לתמונה תלת ממדית של מגדל אייפל, יהיה אפשר גם לראות מודל תלת ממדי של בניין ספציפי כלשהו ברחוב אבן גבירול. זה די מדהים, אם חושבים על זה.

אולם אני חשבתי על השלכה אחרת, דווקא על עולם החיפוש ברשת. לפי ארקאס, ממתכנני התוכנה, המודל מתבסס בין היתר על כך שמאפיינים מסוימים של תמונה נשארים קבועים, כמו למשל פינות של חלונות. כך התוכנה מנתחת את התמונות הרבות ויוצרת קישורים בין תמונה לתמונה. גם אם תמונה אחת מכילה מלבד מגדל אייפל גם את הבחור שהצטלם לתמונה, התוכנה יודעת לערוך את גוף המצולם החוצה.

האם סוג זה של ניתוח תמונות יכול להשפיע על האופן בו חיפוש באינטרנט עובד כיום? נאמר שאתם רוצים לקנות טלוויזיה מדגם מסוים. אם תחפשו מודל זה בגוגל, התוצאה הראשונה שתקבלו תתקבל על סמך האלגוריתם של גוגל, שכולל מספר רב של גורמים. בין גורמים אלו בולטים בעיקר הניתוח הטקסטואלי של המסמך וכן ניתוח של הלינקים לדף זה.

עכשיו חישבו שמנגנון החיפוש לא יהיה מבוסס על ניתוח טקסט ולינקים, אלא על ניתוח תמונות. אתם תגיעו למודל תלת ממדי של דגם הטלוויזיה בו אתם מעוניינים, ותוכלו לשוטט בין האתרים אשר תרמו ליצירת המודל של הטלוויזיה. תוכלו גם להיכנס לאתר שסיפק תמונה כלשהי שאהבתם במיוחד במהלך השיטוט.

דוגמה נוספת – כאשר תחפשו מלון, תוכלו לשוטט ברחוב הוירטואלי ולבחון תמונות שונות של מלונות על סמך איכותן.

האם חיפוש ויזואלי יכול להיות מדויק כמו חיפוש טקסטואלי? בהחלט כן. חישבו על כך שאתרים כגון למטייל או טרקר אכן מספקים תמונות מעולות של המקומות אותם הם מתארים. הבעיה הייתה שעד כה לא היה ניתן להעריך את טיב התרומה הויזואלית הזו.
הדרך לחיפוש המבוסס על תמונות אולי נראית רחוקה, אולם עם ההתפתחויות האחרונות של מיקרוסופט נראה כאילו היא צועדת לכיוון הזה.