אלגוריתם הילטופ

מה זה אלגוריתם הילטופ?

 

בסוף שנת 2003 הוכנס לשימוש אלגוריתם חדש המשמש לדירוג תוצאות החיפוש במנוע החיפוש גוגל – אלגוריתם הילטופ (Hilltop algorithm). הדעות חלוקות לגבי הזמן המדוייק בו הוכנס האלגוריתם לשימוש (האם הוא הוכנס במסגרת ריקוד גוגל פלורידה או לפני-כן), אך קיימת הסכמה כללית כי הוא אכן פעיל ובשימוש מנוע החיפוש גוגל.

משמעות אלגוריתם הילטופ

אלגוריתם הילטופ נבנה על-ידי קרישנה בהראט מקליפורניה, שכתב אותו בשנים 1999-2000. בינואר 2001 הוא רשם על אלגוריתם מסויים פטנט, כשמנוע החיפוש גוגל רשום עליו יחד איתו. הפטנט שונה מן האלגוריתם שהוצג במאמר המקורי, ולא ברור איזו משתי הגישות היא זו המיושמת בפועל. קרישנה עובד כיום בחברת גוגל. אמנם גוגל לא הודיעו מעולם רשמית כי הם משתמשים באיזה מבין האלגוריתמים, אך נראה כי הם לא יוכלו להתעלם מיתרונותיהם.

אם בעבר התעניין גוגל במספר ואיכות הקישורים המקשרים אל דף מסויים, ולא התייחס לשאלה מהיכן הגיעו קישורים אלו, אז כעת ידוע כי המשחק מאז השתנה מאוד.

בין דפי האינטרנט נוצר מעמד חדש של דפים מומחים (Expert Documents). במידה ודף מומחה מצביע אל דף אחר, אז הדבר מהווה "הצבעת אמון" בדף שקיבל את ההצבעה, וחשיבותו של הדף עולה בתוצאות החיפוש. עבורמילות חיפוש שונות יהיו דפים מומחים שונים, כשההבדל העיקרי בין המאמר של קרישנה לבין הפטנט שנרשם הוא בצורת בחירת הדפים המומחים.

דף שלא קיבל קישור (הצבעת אמון) משני דפים מומחים לפחות, לא יקבל ציון מהאלגוריתם כלל! אמנם יתכן כי הוא ימשיך להופיע בתוצאות החיפוש בשל גורמים אחרים (למשל איכות קישורים נכנסים, טכניקות אופטימיזציה מתקדמות שבוצעו, PageRank גבוה או גורמים נוספים המשפיעים על איכות הדף עצמו), אך ברור כי מיקום הדף יפגע מבחינת הפוטנציאל שלו.

כיצד קובעים מיהו דף מומחה הוא מוקד ההבדל בין המאמר המקורי לבין הפטנט שנרשם.

המאמר המקורי אודות אלגוריתם הילטופ, מאת קרישנה בהראט (מאמר להורדה) – Hilltop: A Search Engine based on Expert Documents

רשימת דפים מומחים (Expert Documents) מוכנה מראש

אם קוראים את המאמר שכתב קרישנה בהראט, נראה כי החיפוש לפי האלגוריתם החדש בנוי משלושה שלבים:

  • איתור דפים מומחים – בניית רשימת דפים מומחים מוכנה מראש מבין דפי האינטרנט. רשימה זו היא כללית וקבועה יחסית. מן הרשימה מנופים אתרים מקושרים (ראה בהמשך).
  • התאמת דפים מומחים לשאילתה – כאשר מבוצע חיפוש, הוא קודם מבוצע על רשימת הדפים המומחים, ונוצרת תת-רשימה מתוך הרשימה הגדולה של דפים מומחים לאותו נושא.
  • מתן ציון מקומי לחיפוש (LocalScore) – בעת ביצוע החיפוש עצמו, ניתן ציון מקומי (LocalScore) לכל דף שעולה בחיפוש על פי טקסט העוגן של קישורים נכנסים המגיעים לאתר מתוך רשימת הדפים המומחים שנבחרה בשלב הקודם. אם אין אל האתר לפחות שני קישורים מדפים מומחים, אז הדף כלל לא יקבל נקודות מהאלגוריתם.

דפים מומחים מוגדרים כדפים על נושא מסויים, שנבנו במיוחד כדי להפנות משתמשים למידע באינטרנט על אותו נושא, כלומר שיש בהם לינקים לאתרים אחרים שאינם קשורים אליהם (Affiliated). דוגמאות לדפים מומחים יהיו דפים באינדקסים, אתרים מוסדיים (.org, .gov) ואתרים אוניברסיטאיים (.edu). משמעות עובדה זו היא כי לא מספיק להשיג קישורים מאתרים מסחריים כמו בעבר. צריך להשיג קישורים מדפים בעלי סמכות, שמטבעם יותר קשים להשגה.

חשיבות הרישום הנכון לאינדקסים חשובים וחזקים ואתרים מומחים אחרים עלתה מאד, וירדה חשיבות קישורים מאתרים ודפים "סתם". משמעות נוספת היא חשיבות גדולה לטקסט העוגן בדפים המומחים המקושרים לדף שלכם.

חיפוש תוך דירוג מחדש (Rerank)

אם מביטים בפטנט אותו הוציא קרישנה בהראט יחד עם גוגל, אז נראה כי החיפוש לפי האלגוריתם החדש בנוי משלושה שלבים:

  • חיפוש ראשוני – ביצוע חיפוש רגיל על מילת החיפוש כפי שנעשה לפני הצגת האלגוריתם.
  • ניפוי דפים מקושרים (Affiliated) – הורדת דפים הקשורים בינהם (ראה בהמשך).
  • מתן ציון מקומי לחיפוש (LocalScore) – מתן ציון מקומי (LocalScore) לדפים ברשימה על-פי הקישורים המגיעים אליהם מדפים הנמצאים גם הם ברשימה. ההנחה הבסיסית היא שהדפים ברשימה הם הרלוונטיים לחיפוש זה, ולכן יחשבו רק קישורים מדפים ברשימה.

דפים מקושרים (Affiliated)

בעת ניקוי רשימת הדפים המומחים, מבוצע הניקוי על ידי הורדת דפים בעלי שם דומיין משותף (domain.com, domain.co.il, two.domain.com, www.domain.com) או שהדפים נמצאים באותה קבוצת IP, מ-Class C זהה (שלושת המספרים הראשונים ב-IP זהים – 212.125.23.XXX לדוגמא).

מה קורה עם מונחי חיפוש שוליים?

הדבר תלוי באיזו גירסה של הילטופ מאמינים. אם מתייחסים לגירסה השניה, אז כנראה שכל מה שנדרש הוא שתהיה רשימה ראשונית מספיק גדולה (לאחר סינון דפים קשורים) למילת החיפוש השולית. אם אין מספיק אתרים אז האלגוריתם אינו מופעל.

אם מאמינים בגירסא הראשונה, אז אם החיפוש שנעשה אינו מופיע בין מונחי החיפוש הפופולריים להם הוכנו (או נמצאו בזמן אמיתי) רשימות דפים מומחים, גוגל חוזר להשתמש בשיטת החיפוש הישנה (כלומר, ללא הילטופ).

כיצד מתמודדים עם הילטופ?

קודם כל, ממשיכים לעשות את כל הדרישות קידום אתרים שעשיתם עד כה – אופטימיזציה של האתר או בניית קישורים לשם שיפור ה-PR וציון הרלוונטיות של האתר, עבור ביטויים שאתם מקדמים. משקלם של גורמים נותר משמעותי מאוד עד היום.

המפתח להתמודדות עם הילטופ הוא זיהוי האתרים והדפים המוגדרים כמומחים בתחומו של האתר שלכם. כיצד מוצאים אותם? תלוי באיזו שיטה מאמינים. אם מדובר על רשימת מומחים מוכנה מראש, אז אינדקס האתרים דמוז (DMOZ) יהיה אחד מהמומחים, וכך גם Yahoo!. אינדקסים אחרים אולי נראים כמומחים, אך אינם בהכרח כאלה.

לפי השיטה השנייה צריך לבצע חיפוש אחר מילת החיפוש, ולנסות להשיג קישורים מהדפים המופיעים בתוצאות החיפוש. כמו-כן, כדאי לבדוק את הקישורים הנכנסים אל דפים המופיעים בתוצאות החיפוש בראש התוצאות, ולנסות להשיג את אותם קישורים.

נשארים בלופ

הרשמו לניוזלטר שלנו ועדכונים חמים, מדריכים וטיפים מאנשי המקצוע המובילים בארץ אצלכם במייל, ללא ספאם וללא הטרדות.

עוד קצת ואתם בדרך לקידום אתרים טוב יותר

מלאו את כל הפרטים ונחזור אליכם בהקדם האפשרי. 
רוצים לדבר איתנו על נושא אחר? צרו קשר מכאן