עדכון BERT הוא ללא ספק אחד העדכונים המשמעותיים ביותר של גוגל מהשנים האחרונות, אך אף על פי שגוגל בעצמה אומרת זאת, הוא לא זכה עד כה לתשומת לב גדולה במיוחד בקרב מקדמי האתרים, אפילו בהשוואה ל-Rankbrain, שהוא האלגוריתם הקרוב אליו ביותר.
על פי גוגל, האלגוריתם הופעל לראשונה על שאילתות באנגלית ב-21 באוקטובר ובדצמבר 2019 על שאילתות בעוד שבעים שפות נוספות (כולל עברית). בסך הכול הוא משפיע בערך על כ-10% מן השאילתות.
אז מה זה בעצם BERT?
ראשי התיבות של BERT הן Bidirectional Encoder Representations from Transformers (ואני אפילו לא אנסה לתרגם את זה לעברית…).
באופן הכי פשוט לתיאור, BERT עוזר לגוגל בעיבוד של שפה טבעית והוא מדמה רשת נוירונים מלאכותית.
בפועל הוא מעניק לגוגל כמה יכולות משופרות. היכולת העיקרית היא הבנה טובה יותר של ההקשר עבור מילים שונות בשאילתה.
לדוגמה, כאשר ישנו כפל משמעות.
אם ניקח את הביטוי באנגלית "nine to five" הרי שיש לו משמעות אחת של "מתשע ועד חמש" ומשמעות שניה של "9 דקות לפני השעה חמש". חוץ מזה מדובר גם בשם של סרט…
אם נסתכל על עוד יכולות של רשתות נוירונים כאלו, נוכל לראות עוד כמה שימושים שיכולים להעניק יתרון לגוגל:
- בניית מודלים של לחיצות לצורך דירוג של תוצאות גם ללא נתונים אמיתיים.
- קטלוג של תכנים כגון תמונות
- זיהוי כתב יד
- ועוד…
החלק המפתיע הוא שלמרות שגוגל הטמיעה את BERT באלגוריתם שלה רק בשנה שעברה, הטכנולוגיה עצמה הייתה זמינה לכל דורש (בקוד פתוח) כבר מנובמבר 2018.
בניסוי המקורי החוקרים בגוגל הראו כיצד ברט יכול לענות על שאלות של השלמת סיפורים (איזה משפט מתאים כהמשך למשפט הקודם) באחוזים גבוהים הרבה יותר ממערכות קודמות, כמעט כמו אלו של בני אדם.
זאת קצת בדומה למבחן טיורינג, אף על פי שאנחנו כנראה עדיין רחוקים מאוד משם.
עוד על עיבוד שפה טבעית (NLP)
עיבוד שפה טבעית, או NLP (לא להתבלבל עם הטכניקה לשינוי מחשבתי בתחום של אימון אישי) הוא תהליך שבאמצעותו מאמנים את המחשב (או נכון יותר אלגוריתם) להבין כיצד בני אדם מתקשרים זה עם זה.
יישומים של NLP יכולים להיות ניתוח טרנדים ואזכורים במדיה חברתית (כמו למשל השירות של Awario), הפעלת צ'טבוטים והצעות להשלמה אוטומטית (אף על פי שגוגל כבר מפעיל השלמות אוטומטיות, ולא רק על פי שאילתות קודמות כבר כמה שנים טובות)
על מנת לראות את הפוטנציאל האורגני ותוך כמה זמן נכפיל לך את ההכנסות
ניתן לחייג למספר 052-9095200 או למלא את הטופס:
אחד החידושים אותו מציע BERT הוא היכולת להבין הקשרים גם בין מילים הקרובות אחת לשנייה ולא רק על פי סדר הקריאה שאנחנו רגילים אליו כגון מימין לשמאל או שמאל לימין. למעשה, הוא יכול אפילו לנחש מילים חסרות כאשר אין יותר מדי אפשרויות.
בין היתר גוגל אימנה את BERT באמצעות קריאה של דפים מויקיפדיה וכמות גדולה מאוד של טקסטים מספרים. כמות כזו של מידע דורשת כוח מחשוב אדיר, משהו שכידוע לא ממש חסר לגוגל.
גוגל גם נתנה כמה דוגמאות לשאילתות אותן היא יכולה להבין טוב יותר:
1. בשאילתה "math practice books for adults" (ספרי לימוד במתמטיקה למבוגרים):
התוצאה הראשונה החזירה ספר לימוד לגילאים 8-6, אך לאחר העדכון של BERT, התוצאה הייתה "Math for Grownups" שהיא התוצאה "הנכונה". מעניין לציין כי התוצאה המקורית עדיין מופיעה, אבל במיקום נמוך יותר.
2. "2019 brazil traveler to usa need a visa":
הכוונה כאן היא לתייר מברזיל שצריך ויזה עבור ביקור בארה"ב.
לפני BERT גוגל התבלבל וחשוב שמדובר במקרה ההפוך. לעומת זאת, עם BERT זה לא קורה. הסיבה המדויקת היא שמנוע החיפוש לא הביא בחשבון את החשיבות של מילת הקישור "to" ("ל").
3. "do estheticians stand a lot at work" (האם מומחי אסתטיקה עומדים הרבה בעבודה):
לכאורה זו שאילתה פשוטה, אבל באנגלית קיים צירוף נפוץ בשם "stand alone" (לעמוד לבד).
לכן, לפני השימוש ב-BERT, גוגל החזיר תוצאה שמשווה בין שתי עבודות בתחום. לאחר השימוש ב-BERT גוגל החזיר את התוצאה "הנכונה" על הדרישות הפיזיות שנדרשות ממי שעובד בתחום.
כמו שאפשר לראות, מדובר כאן לא רק בשיפור היכולת להבין את ההקשר בין כל מילה למילים אחרות במשפט, אלא גם ביכולת להבין אם למילה יש חשיבות גבוהה להבנת המשמעות הכללית של המשפט.
באופן מפתיע, מסתבר שלא תמיד גוגל באמת התייחס לכל המילים ומכאן נבעו לא מעט תוצאות משונות…
במה שונה Rankbrain מ-BERT?
אף על פי ששני האלגוריתמים האלו משמשים לעיתים למטרות דומות, BERT לא נועד להחליף את ראנקבריין בין היתר מכיוון שהם עובדים בשיטות שונות:
בעוד BERT מסוגל לקרוא את המילים בשאילתה בכל מיני כיוונים, ראנקבריין משנה את התוצאות עבור השאילתה שהמשתמש הקליד בהסתמך על הרלוונטיות של שאילתות קודמות שהוא ניתח.
לכן, אחת היכולות הבלעדיות שלו היא החזרת תוצאות עם מילים מתאימות גם אם אלו לא הופיעו בשאילתה עצמה.
האם בתור מקדמי אתרים BERT אמור לגרום לנו לשנות את הדרך בה אנחנו מקדמים?
מכיוון ש-BERT הוא אלגוריתם מורכב יחסית שהיכולות שלו מנסות לחקות את המוח האנושי, אין משהו ספציפי שהוא מחפש, וזאת בניגוד לאלגוריתמים שמתמקדים בקישורים, איכות התוכן, ספאם, מהירות וכו'.
זו כנראה גם הסיבה לכך שגוגל טוענת שבעלי אתרים לא צריכים לעשות משהו מיוחד כדי להתכונן אל BERT.
גם אם זה נכון, עדכון BERT יכול דווקא לעזור לנו להבין ממה להתרחק ואילו מגמות בחיפוש הולכות להתחזק:
1. מכיוון ש-BERT משפר מאוד את היכול לזהות את המשמעות של מילים ספציפיות בתוך המשפט, דווקא מי שינסה לדחוף מילות מפתח בתוך משפטים בהקשר לא מאוד מוצלח (כפי שהרבה בוני קישורים עדיין עושים) עלול להיכוות, לכן אני תמיד אומר שעדיף לחשוב מה יעבוד בגוגל גם בעתיד ולא מה עובד עכשיו.
זה נכון גם לגבי מילות מפתח כמו "צימרים מחיר".
נכון שככה אנשים מחפשים, אבל BERT מספיק חכם כדי להבין שהשאילתה הזו דומה ל – "מחירי צימרים" ואולי אפילו "כמה עולה צימר" (אף על פי שזה יותר התפקיד של Rankbrain).
לכן, לא להשתמש במילות המפתח האלו עשויה להיות טעות.
2. בין המגמות בחיפוש שרק ילכו ויתחזקו אפשר לחשוב על כתיבת תוכן על הנושא בו עוסק הדף באופן מקיף יותר, הצגת מידע בסגנון של שאלות ותשובות עבור חיפוש קולי וכו'.
לדוגמה, אפשר להשתמש בשיטה של "אשכולות תוכן" (Topic Clusters).
כאשר משתמשים באשכולות תוכן, מפרקים כל נושא לתתי נושאים ולאחר מכן אפשר גם לכמה תתי נושאים נוספים עם קישורים ביניהם. זה דורש לא מעט עבודה, אבל יכול להשתלם ולהביא לכם תנועה ממוקדת. מעבר לכך, לא תמיד קל ליצור מספיק תוכן עבור כל ביטוי של זנב ארוך.
3. ברט עשוי להוכיח פעם נוספת עד כמה חשוב להפוך את טקסט הקישור (ה-Anchor Text) לבעל משמעות (גם בקישורים פנימיים וגם בקישורים חיצונים) ולא רק להשתמש במילות מפתח שיכולות להתאים ל-1000 עמודים שונים ברשת.
יש גם לזכור שלמרות ש-BERT מופעל כיום על עברית והמון שפות נוספות, הוא לומד על בסיס טקסטים קיימים, ולכן סביר להניח שהיכולות שלו טובות במיוחד בשפות כמו אנגלית, צרפתית או גרמנית ופחות בשפות אזוטריות יחסית כמו שלנו.