![]() | ![]() |
|


האנשים מאחורי המנוע: סרגיי ברין (גוגל), ג'רי יאנג (יאהו) ולארי פייג' (גוגל) | צלם: TheMarker
השבוע האחרון עמד ללא ספק בסימן כניסתו לזירה של מנוע החיפוש קול (Cuil). בתור חובב ותיק של טכנולוגיות חיפוש בכלל והאופן בו פועלים מנועי חיפוש בפרט, ביליתי בימים האחרונים זמן רב עם השירות החדש בניסיון לבדוק כיצד הוא עומד בהשוואה למובילי התעשייה - גוגל, יאהו, לייב (Live), ו-Ask.
כאשר אני ניגש להעריך את הביצועים של מנועי החיפוש המרכזיים, ישנם מספר גורמים הנתפסים בעיני כקריטיים. הגורמים הללו הם (לפי הסדר): רלוונטיות התוצאות, כיסוי, רעננות, גיוון, וחוויית משתמש. תחילה, בואו נעיף מבט מהיר על הציון הכולל של חמשת המנועים, ואז נצלול עמוק יותר לכל אחד מהקריטריונים.

כמה אבחנות בנוגע לממצאים:
• אני לא ממש מופתע למצוא את יאהו במקום הראשון. למרות חולשה מסוימת בשאילתות על נושאים אזוטריים, כאשר מסתכלים על התמונה הכללית יאהו נמצאת בפסגה לצד גוגל. זו גם ככל הנראה הסיבה שאנשים לא עברו לחלוטין לגוגל למרות המותג החזק יותר אותו בנתה החברה בתחום החיפוש.
• גוגל טובה בכל הפרמטרים - שוב, לא הפתעה גדולה. מנוע החיפוש של גוגל הוא העקבי ביותר ומקבל תוצאות מרשימות כמעט בכל מבחן. לטעמי, למרות שיאהו קיבל את הציון הסופי הגבוה ביותר, גוגל הוא עדיין המוביל בין מנועי החיפוש, ואליו צריכים שאר המתחרים לשאת את עיניהם.
• למנוע החיפוש של Ask יש לא מעט יתרונות בכל מה שקשור לגיוון וחוויית משתמש, זאת תודות לממשק התלת-ממדי שלו אשר לדעתי מספק תוצאות באמת מצוינות, במיוחד בנושאי חיפוש הזוכים לפופולריות רבה.
• בכל מה שקשור לגודל האינדקס, נראה כי יאהו הוא המנצח, אולם אני מעריך כי ייתכן שהבדיקה אותה עשיתי מעט מטעה. למרות שיאהו מחזיק באופן ברור יותר דפים על רבים מהמתחמים (domains), אני חושד שגוגל הוא למעשה גם המהיר יותר וגם הרחב יותר, אבל פשוט מחזיק פחות מידע באינדקס המרכזי (מה שאולי אפילו מסייע לרלוונטיות של התוצאות). בנוסף, גוגל עושה עבודה מצוינת בביטול כפילויות, תחום בו יאהו ושאר המנועים לוקים בחסר.
• ההפתעה הגדולה ביותר מבחינתי? לייב של מיקרוסופט. אני המום מכך שהאיכות והרלוונטיות של לייב כל כך גבוהים יחסית. לא עשיתי מחקר מסוג זה מאז 2006, אולם כמה עשרות החיפושים אותם הרצתי בלייב כל חודש תמיד השיגו תוצאות גרועות בהשוואה למה שקיבלתי הפעם. אין ספק כי הוא משתפר, והופך לשחקן רציני בתחום. בעייתו הגדולה ביותר היא עדיין ספאם וקישורים שתולים (אותם אלגוריתם הניתוח שלו לא מצליח לאתר ולמחוק). אם האנשים במיקרוסופט יצליחו לתקן את זה, אני חושב שהם בדרכם להיות מנוע חיפוש מוביל.
• קול לא תומך בחלק גדול מהאפשרויות הסטנדרטיות של חיפוש מתקדם כגון שלילת מילות מפתח, חיפוש בכותרות בלבד (intitle:) וכדומה, מה שמקשה מאוד למדוד אותו בכל מה שקשור לגודל האינדקס (למרות שמצבים בהם החזיר אפס התאמות לשאילתות בהן מנועי החיפוש האחרים החזירו מאות ואלפי תוצאות מדברים בעד עצמם).
• האנשים בקול עשו שטות בכך שיצאו בהשקה דווקא עכשיו. בהתחשב בבאז שהיה סביבם והפוטנציאל לכבוש נתח שוק (אפילו שבריר אחוז שווה מיליונים), הם היו צריכים להעסיק הרבה אנשים כמוני שיבצעו הרבה מבחנים כמו זה, ויראו להם באיזה פיגור הם נמצאים בהשוואה לשאר מנועי החיפוש הגדולים. אתם מקבלים רק צ'אנס אחד לעשות רושם ראשוני, והרושם שלהם נהרס. אני לא מתכוון לנבא עדיין את כישלונם, אבל אני בהחלט צופה שייקח עוד זמן רב עד שמייקל ארינגטון (מייסד TechCrunch) או כל אדם אחר בתעשיית ההיי-טק או בתקשורת יאמין פעם נוספת להבטחות שלהם ללא הוכחות חותכות. האינדקס של קול, ממה שהצלחתי לבדוק, קטן יותר מכל אחד מהמנועים האחרים, והרלוונטיות שלו נמוכה יותר באופן עקבי. באופן אישי, אני מרגיש ממש רע עבורם - היו לי תקוות רבות שמישהו יקרא סוף סוף תיגר על גוגל ויהפוך את שוק החיפוש למעניין יותר. נו טוב, אולי בפעם הבאה (בהנחה שקרנות הון סיכון תהיינה מוכנות להמשיך לזרוק למעלה מ-30 מיליון דולר על מיזמים מסוג זה).
כמה מילים על מתודולוגיה:
בכל אחד ממנועי החיפוש הרצתי מספר חיפושים השונים זה מזה מבחינת סוג מחרוזת השאילתה. זהו המקום בו הבנה כיצד עובדת עקומת הדרישה של מנועי חיפוש חיונית לקביעת הביצועים. יש מנועים שמצטיינים בהחזרת תוצאות מעולות עבור השאילתות הפופולריות ביותר, אולם לוקים בחסר בשאילתות אזוטריות השייכות ל"זנב" של עקומת הדרישה. על מנת להיות מנוע חיפוש טוב באמת, עליך להיות מסוגל להתמודד היטב עם שני המצבים.

במרבית המקרים, עשיתי שימוש במונחי חיפוש וביטויים שמייצגים נקודות שונות על פני עקומת הדרישה, החל מהשאילתות הפופולריות ביותר (כגון "Barack Obama" ו-"Photography") וכלה בשאילתות אזוטריות (כגון "pacific islands polytheistic cultures" ו-"chemical compounds formed with baking soda"). תוכלו לראות רשימה מלאה של השאילתות בהן השתמשתי מתחת לכל סעיף. במהלך הבדיקה, עשיתי שימוש בסולם הציונים הבא על מנת לדרג את איכותם של מנועי החיפוש:

כעת בואו נצלול אל תהליך איסוף המידע
רלוונטיות מוגדרת על ידי האיכות הבסיסית של התוצאות - ככל שהן יותר נוגעות לנושא ובעלות ערך עבור המשתמש, כך רמת הרלוונטיות גבוהה יותר. מדידה של איכות היא תמיד דבר סובייקטיבי אולם מניסיוני, אפילו מספר נמוך של שאילתות יכול לספק תובנות לגבי איכות התוצאות של מנוע חיפוש. על מנת לקבוע רמת רלוונטיות, פשוט הערכתי את המידה בה התוצאות ענו על צרכי השאילתה, ונתתי ציון טוב ככל שהתוצאות המתאימות הופיעו יותר גבוה במעלה הרשימה.

להלן השאילתות בהן עשיתי שימוש על מנת לבחון את ביצועי מנועי החיפוש
• עבור שאילתות "סופר-פופולריות": gas prices, iphone, facebook, dark knight, barack obama
• עבור שאילתות פופולריות: laptops, photography, rental cars, scholarship, house plans
• עבור שאילתות בעלות רמת פופולריות בינונית: fire prevention, calendar software, snow tires, economic stimulus payment, nintendo wii games
• עבור שאילתות אזוטריות: pacific islands polytheistic cultures, chemical compounds formed with baking soda, genuine buddy 50 scooter reviews, google toolbar pagerank formula, getting a novel published
• עבור שאילתות בנושאים טכניים: metalworking inurl:blog, cricket -site:.co.uk -site:.com.au, dark crystal site:imdb.com, top * ways, definition sycophant
כיסוי (Coverage) מלמד בעצם על גודל האינדקס של מנוע החיפוש ומהירותו של תהליך הקיטלוג - ככל שהאינדקס גדול והתהליך מהיר יותר, כך מספר הדפים הרלוונטיים אותם יכול המנוע להחזיר גדול יותר. על מנת למדוד אספקט זה, התמקדתי בכיסוי של אתרים ספציפיים (גדולים וקטנים), וכן הרצתי שאילתות השייכות לזנב של עקומת הדרישה.

השאילתות בהן עשיתי שימוש
• עבור אתרים גדולים: site:government.hp.com, site:research.ibm.com/leem, welsh rugby site:bbc.co.uk, search engine optimization site:w3.org, tango tapas seattle site:nytimes.com
• עבור אתרים בינוניים: site:seomoz.org/blog, site:news.ycombinator.com, site:education.com/magazine, bumbershoot site:thestranger.com, snowboards site:evogear.com
• עבור אתרים קטנים: site:downtownartwalk.com, site:amphl.org/, site:totebo.com, dockboard site:loadingdocksupply.com, site:microsites.audi.com/audia5
למרות שכיסוי יכול ללמד על גודל האינדקס ומהירות בניית הקטלוג, רעננות (Freshness) של תוצאות מלמדת על מאמץ אמיתי של מנוע החיפוש למקם פריטי חדשות טריים ורלוונטיים כמו גם נושאים חמים אחרים בראש רשימת התוצאות. עשיתי שימוש בכמה וכמה שאילתות הקשורות לאירועים עדכניים, גם כאלה שזכו לפופולריות רבה וגם כאלה שנותרו לא מוכרים (כולל דפים חדשים השייכים למתחמים קטנים יחסית) על מנת לבחון את דרגת הרעננות אותה מספק מנוע החיפוש.

• נושאים "סופר-פופולריים": los angeles earthquake, obama germany, gas prices, ted stevens, beijing Olympics
• נושאים פופולריים: new york city weather, dow jones average, seattle mariners schedule, cuil launch, nasa news
• נושאים בעלי רמת פופולריות בינונית: warp speed engine, unesco world heritage, movie times 98115, comic con 2008, most charitable us cities
• נושאים לא מוכרים: melinda van wingen, over the hedge comic 7/28, seomoz give it up blog, scrabulous facebook, internet startups that failed miserably
כאשר שאילתות חיפוש הופכות מעורפלות או דו-משמעיות, מנועים פחות טובים מתקשים לספק תוצאות איכותיות, בעוד המנועים המובילים מסוגלים לספק ערך מוסף גבוה בזכות מגוון רחב של תוצאות ואפילו על ידי שהם מציגים הצעות לשיפור השאילתה על מנת להפוך אותה לברורה יותר.

• שאילתות מאוד דו-משמעיות: mouse, ruby, drivers
• שאילתות בעלות רמה מסוימת של דו-משמעות: comics, shipping, earth
• שאילתות ברורות יחסית: ibm, harry potter, graphic design
• שאילתות שמשמעותן ברורה לחלוטין: seattle children's hospital map, color wheel diagram, great gatsby amazon
העיצוב, הממשק, המאפיינים, המהירות, ואיכות התוצאות כולם נכללים בקטגוריה של חוויית משתמש. מנוע שמציע תצוגה יוצאת דופן עשוי לקבל דירוג גבוה או נמוך, בהתאם לאיכות התוצאות שהוצגו והאם המידע הנוסף המתאפשר בזכות העיצוב המיוחד אכן מספק ערך מוסף. במקום להריץ סדרה של שאילתות, שפטתי את כל אחד מהמנועים בהתבסס על ההיצע שלהם בתחום תוך שימוש במידע שצברתי בשאר חלקי המבדק, וכן על סמך ניסיוני הקודם עם כל אחד מהם.

טבלת חוויית המשתמש מתבססת על הפרמטרים הבאים
• Query Speed - הזמן הממוצע מרגע הלחיצה על כפתור החיפוש ועד טעינתו באופן מלא של דף התוצאות.
• Results Layout - סידורן של התוצאות על הדף, קיומן של מודעות פרסום, הצעות לשאילתות אלטרנטיביות, אפשרויות ניווט, וכדומה.
• Vertical Inclusion - הכללתן של תשובות מיידיות (instant answer) כחלק מהתוצאות (כלומר, כאשר אני מריץ שאילתה כגון "what is the currency in Israel" אני מצפה שבראש הרשימה תופיע התשובה הפשוטה "New Israeli Sheqel".
• Query Assistance - השימוש בשאילתות דומות/קשורות והתמודדות עם רב-משמעויות.
• Advanced Features - היכולת לבצע חיפושים ספציפיים לאתר, האפשרות לחפש מונחים אך ורק אם הם מופיעים בכותרת, אפשרות לצמצם את החיפוש על פי שם מתחם, וכדומה.
אם אתם מתעניינים, להלן תמונת מסך של הגיליון האלקטרוני שייצרתי ב-Google Docs על מנת לרכז את תוצאות המבדק (תוכלו לקרוא את המסמך המלא בקישור הבא)
מבדק מהסוג הזה מצריך עבודה רבה, ולמרות שהוא אינו מדויק מבחינה מדעית או סטטיסטית, ואף ללא ספק מוטה (אני השופט היחיד), אני חושב שהתוצאות דווקא די מועילות ומדויקות, אם כי יהיה זה מרתק להריץ מחקרים פומביים כמו זה על בסיס מדגם רחב בעל משמעות סטטיסטית.
הכותב הינו בלוגר ומייסד האתר הטכנולוגי SEOmoz.org
עוד בנושא - המתחרה של גוגל: עובדים לשעבר בחברה משיקים היום מנוע חיפוש בשם Cuil | מעניין לי את הקולי | דיונים חמים בנושא, בקהילת ווב 2.0 ב-TheMarker Cafe