זמן קריאה: 5 דקות

העדכונים הגדולים והחשובים ביותר במנוע החיפוש של גוגל זוכים כידוע לפוסטים אצל מאט קאטס או בבלוג גוגל הראשי, והעדכונים המיועדים להתמחויות ספציפיות מתפרסמים בבלוגים המקצועיים של כלי מנהל האתרים, האדוורדס, המובייל או האנליטיקס. אבל בין הבלוגים של גוגל יש בלוג נוסף שהוקם בשנה האחרונה – Inside Search: The Official Google Search Blog. הבלוג מציג שינויי אלגוריתמים "קטנים" יותר בגוגל, ובתוך כך מאפשר להציץ בעבודה היומיומית השוטפת של מהנדסי גוגל.

בפוסט האחרון פורסמו 30 שיפורים במערכת החיפוש שנעשו בידי מהנדסי גוגל במהלך דצמבר 2011 (30 שינויי אלגוריתם במשך 30 יום! – הספק לא רע בהתחשב בכל עמדות הפלייסטיישן ושולחנות הסנוקר הפזורים במשרדים בפאלו אלטו). הנה כמה מהחשובים שביניהם:

  • הכרה טובה יותר של מילים נרדפות בעברית: עיקרו של השינוי הוא ביכולת טובה יותר לתרגם מילים נרדפות בעברית על פי הקונטקסט שלהם במשפט, אבל אפשר להסיק מכך שגוגל הולכת ומשתפרת בהבנה של הקשרים ומשמעויות גם בעברית.
  • סיגנלים לקביעת איכות דף תמונה במנוע חיפוש התמונות (Image Search): כבר שיערנו מזמן שאחד הפרמטרים באופטימיזציה של תמונות ברשת הוא הקשר בין התמונה והטקסט סביבה, ואכן, גוגל מודיעים רשמית שגם מנוע חיפוש התמונות יציג בראש התוצאות לא רק את התמונות הרלוונטיות ביותר לחיפוש אלא את אלה המוצגות בדפי הנחיתה האיכותיים ביותר.

google images

  • דרך אגב, גוגל פרסמו בפוסט זה שני עדכונים נוספים למנוע חיפוש התמונות: האחד הוא זיהוי ספאם במרחב התמונה (המשך ישיר לסיגנל איכות דף התמונה), והשני הוא מתן דגש רב יותר לגודל התמונה המקורית, והכלל כאן פשוט: כמה שיותר גדול יותר טוב. אז אמנם מוקדם עדיין לומר שתמונה אחת שווה אלף מילים בגוגל, אבל נראה שכדאי לרענן את טכניקות אופטימיזציית התמונות, כי הן הולכות ונעשות חשובות יותר ויותר בתוצאות החיפוש.
  • אבחון דפי Soft 404 : Soft 404 הוא כידוע כינוי לדפים שנראים על פי תוכנם כדפי שגיאה 404 (הדף לא נמצא), למשל דף שגיאה מותאם אישית, אבל על פי ה-HTTP Response שלהם מחזירים תגובת 200 (הדף נמצא). מנועי חיפוש מתקשים להבין – בעיקר בשפות שאינן אנגלית – האם לפניהם דף תקין (200) שעליהם לסרוק ולאנדקס או דף שגיאה כללי המודיע שהדף שאליו הופנו לא נמצא. השיפור הנוכחי מקל על גילוי דפים אלה. אבל נקודה זו היא בכל מקרה תזכורת טובה למנהלי האתרים לחזור ולבדוק בעזרת Web sniffer או אפשרות Fetch as Googlebot שבכלי מנהלי האתרים אם אכן דף השגיאה באתר שלהם מחזיר את תגובת 404 המתאימה.

 

soft 404

  • חיפוש מוצפן גם בדומיינים מקומיים: כפי שפרסם יניב נבות בבלוג הזה לפני כחודשיים, גוגל מטמיעים את מנוע החיפוש המאובטח (https://www.google.com) כמנוע ברירת מחדל עבור משתמשים מחוברים לגוגל. מעתה ייהנו גם גולשי הדומיינים המקומיים הגדולים (צרפת, בריטניה וגרמניה) מהפרטיות המפוקפקת הזו (שהרי בתוצאות הממומנות היא לא קיימת).
  • תוצאות חיפוש מדויקות יותר על פי מדינה: בחיפוש גוגל בדומיינים מקומיים שאינם .com – כמו למשל www.google.co.il – גולשים יכולים לבחור להציג תוצאות רק מהמדינה שלהם. השיפור באלגוריתם הנוכחי מאפשר לגוגל לזהות טוב יותר את מקורם הגיאוגרפי של הדפים ברשת ולהציג תוצאות מדויקות יותר בחיפושים ממין זה.
  • גילוי טוב יותר של Rich Snippets: השיפור הנוכחי מאפשר למנוע החיפוש לזהות טוב יותר דפי ביקורות, מתכונים וקניות הכוללים Rich snippets. גוגל מבטיחים שבזכות הזיהוי המשופר נראה יותר דפי Rich snippets בתוצאות החיפוש.
  • שני שיפורים מעניינים הנוגעים ל'חיפושים קשורים' המופיעים בתחתית תוצאות החיפוש: גוגל שיפרו את בסיסי הנתונים והאלגוריתמים המאפשרים הצגה של חיפושים קשורים כדי שנוכל לקבל הצעות רלוונטיות וממוקדות יותר לחיפוש המשך. מעניינת בהקשר הזה תוצאת החיפוש הקשור: Google browser המופיעה בחיפוש אחר המילה Browser. כפי שפרסם כאן תמיר אורון גוגל הודיעה לפני כמה ימים שהיא מענישה את דפדפן הכרום שלה ודוחקת אותו בתוצאות החיפוש אחר המילה Browser כיוון ששיווקו באמצעות קניית קישורים מבלוגרים היה הפרה של הכללים של גוגל עצמה לבעלי האתרים. גוגל כנראה "שיפרו" כל כך את בסיסי הנתונים והאלגוריתמים שלהם עד שהקשר שבין השאילתא Browser לבין תוצאת החיפוש Google Browser נעלם ואיננו… (גוגל כאילו אומרת: כרום הפר את הכללים ולכן ייענש, אבל לעומת זאת, הדפדפן של גוגל לא קשור בכלל לכל הבלאגן הזה).

 

google browser

  • גלישה מהירה יותר לניידים (Mobile): אולי עוד רמז לכך ששנת 2012 הולכת להיות שנה חשובה מאוד ל-mobile בגוגל. אתרים רבים מפנים גולשי טלפונים חכמים (הטלפונים… לא הגולשים) לדפי אתר מותאמים לדפדפני סמארטפון. השיפור הנוכחי מציג את כתובת היעד של הדפים המותאמים בתוצאות החיפוש לניידים ובכך מבטל את ההפניות שבדרך ומאיץ את הגלישה.
  • שיפור בקביעת ה-Sitelinks: שיפור האלגוריתם הקובע את ה-Sitelinks בכדי לאפשר קישורים רלוונטיים יותר תחת שם המותג, למשל של מיקום סניף של עסק על פי מיקום הגולש.
  • בפוסט מוזכרים עוד כמה שינויים כמו: זיהוי ושימוש טוב יותר של תאריכים בדפי האינטרנט, שיפור בחיפוש מילות שירים, שינוי בהצגתם של כפתורי 1+ בתוצאות החיפוש – מעתה הם אמורים להופיע רק כשהסמן מעליהם או כשהתוצאה כבר סומנה ב-1+ (גוגל טוענים שהסיבה אסתטית, אבל אפשר לנחש שגם מיעוט הלחיצות על הכפתור הייתה בעיה "אסתטית" מבחינתם), הצגה מפורטת יותר של אירועים (למשל הופעות או מסיבות) לצד תוצאות החיפוש על מועדון מסוים למשל, Autocomplete משופר (עדכון תשתית שיעזור לאלגוריתם ההשלמה האוטומטית לתקן שגיאות כתיב כבר בהקשת האותיות הראשונות של מילת החיפוש), ו'חיפוש בטוח' בטוח יותר: מסנן החיפוש הבטוח (Safe Search) יסנן מעתה טוב יותר תוכן למבוגרים בלבד (ויפסיק להציג למבוגרים תוכן ילדותי :)).