האם ציוץ חריג של פוליטיקאי הוא פליטת פה או אסטרטגיה מחושבת? ניסוי בינה מלאכותית (AI), בודק - האם מודלי שפה יכולים למדוד בצורה אובייקטיבית עד כמה אדם "צפוי" בסגנון הכתיבה שלו? התשובה היא כן, כי בעוד הפוליטיקה הממסדית מוחקת את הקול האישי, דמויות שאינן כפופות לחוקי המשחק, כמו טראמפ ומאסק ששובר את כל המדדים, מייצרות "כאוס סטטיסטי" שהמודלים פשוט לא מסוגלים לחזות.
היכולת לקחת תכונות אנושיות חמקמקות כמו "טון" או "סגנון", לפרק אותן למספרים ולהציג אותן על ציר, היא קפיצת מדרגה באופן שבו אנו יכולים לנתח שיח פוליטי והמספרים מוכיחים זאת.
בזמן שכולנו מנסים לנחש האם ציוץ חריג של פוליטיקאי הוא פליטת פה או אסטרטגיה מחושבת, שאלתי את עצמי: האם ניתן לכמת את "תחושת הבטן" הזו למספרים מדעיים? ניסוי בינה מלאכותית (AI) שניתח 220,000 ציוצים מספק תשובה חותכת: למרות התהום האידיאולוגית, דמוקרטים ורפובליקנים כותבים באותו אופן רובוטי וצפוי לחלוטין. לעומתם, טראמפ מתנהל בכאוס סגנוני משלו, ואילון מאסק שובר את כל המדדים.
בזמן שכולנו עוקבים אחרי הציוצים של דונלד טראמפ ומנסים לנחש מתי מדובר ב"הפוך על הפוך", מתי בטרולינג טהור, ומתי זו פשוט פליטת מקלדת - שאלתי את עצמי: למה להסתמך על תחושות בטן? האם אפשר לקחת את התחושה החמקמקה הזו, שפוליטיקאי מסוים פשוט אינו צפוי בעוד אחרים נשמעים מתוסרטים, ולכמת אותה סטטיסטית?
התשובה, כך מתברר, היא כן.
בפרויקט מחקר עצמאי שערכתי, ביקשתי לבדוק האם מודלי שפה יכולים למדוד בצורה אובייקטיבית עד כמה אדם "צפוי" בסגנון הכתיבה שלו? המסקנות העולות מהנתונים מנפצות כמה מיתוסים על השיח הפוליטי בארה"ב: האלגוריתמים הוכיחו כי הפוליטיקה הממסדית מוחקת לחלוטין את הקול האישי - עד כדי כך שסנטור רפובליקני וסנטור דמוקרטי כותבים באותו DNA טקסטואלי בדיוק. לעומתם, דמויות שאינן כפופות לחוקי המשחק השמרניים, כמו טראמפ ומאסק, מייצרות "כאוס סטטיסטי" שהמודלים פשוט לא מסוגלים לחזות.

איך מודדים כאוס?
במקום לשאול "האם המשפט הזה מוזר לאדם הנורמלי?", השאלה שצריכה להישאל היא "האם המשפט הזה מוזר ביחס לאדם עצמו?". תחשבו על חבר שכל חייו מדבר אך ורק על כדורגל, ויום אחד זורק לחלל האוויר הערה על בלט קלאסי. בלט הוא נושא נורמלי לחלוטין, אבל עבור אותו חבר ספציפי מדובר באירוע חריג. בדיוק את סטיית התקן הזו מהסגנון האישי ניתן היום למדוד באופן מדעי בעזרת מודלי שפה (LLMs).
כדי לבחון זאת, יצאתי לפרויקט מחקר. לקחתי 220,000 ציוצים מהעשור האחרון, ואימנתי ארבעה מודלי שפה נפרדים (המבוססים על ארכיטקטורת GPT-2) על ארבע "פרסונות" רשת שונות: דונלד טראמפ, אילון מאסק, ושתי קבוצות: כלל חברי הקונגרס הדמוקרטים, וכלל חברי הקונגרס הרפובליקנים.
כל מודל ננעל ב"חדר וירטואלי" וקרא רק את הטקסטים של הפרסונה שלו, עד שלמד בעל פה את דפוסי הכתיבה, אוצר המילים והקצב הייחודי לה. לאחר מכן, הזנתי למודלים טקסטים חדשים ובדקתי את מה שנקרא בעגה המקצועית "Perplexity" - מדד ההפתעה. ככל שהמודל התקשה יותר לחזות את המילה הבאה, כך ציון ההפתעה קפץ. השונות בציונים הללו יצרה את מה שכיניתי "מדד הכאוס" (Chaos Index). התוצאות שפלטו האלגוריתמים היו מרתקות ומלמדות על השיח הפוליטי ברשת.
אשליית הקיטוב: הפוליטיקאי כרובוט
בעידן שבו אנו רגילים לחשוב על הפוליטיקה האמריקאית כזירה מקוטבת לחלוטין, עם שתי מחנות שלכאורה אינם חולקים שפה משותפת, הנתונים הסטטיסטיים סיפרו סיפור אחר לגמרי.
כשבדקתי את מדד הכאוס (כלומר, עד כמה הסגנון של הקבוצה תנודתי ובלתי צפוי), הסנטורים הדמוקרטים קיבלו ציון של 17.6, והסנטורים הרפובליקנים קיבלו ציון של 18.0. מדובר בתיקו סטטיסטי כמעט מושלם. שתי המפלגות, על אף התהום האידיאולוגית ביניהן, מפיקות את אותה כתיבה רובוטית, מתוסרטת ונוסחתית.
הרובוטיות הזו בולטת במיוחד כשמסתכלים על המשפטים שקיבלו את ציוני ההפתעה הנמוכים ביותר. אלו סיסמאות שהמודלים פשוט "שיננו בעל פה":
הציוץ הצפוי ביותר לדמוקרטים (מדד הפתעה: 3.2):
"אנשים, לא פוליטיקאים, צריכים לקבל את החופש לקבל החלטות על שירותי הבריאות שלהם בעצמם".
הציוץ הצפוי ביותר לרפובליקנים (מדד הפתעה: 2.8):
"ביטחון גבולות הוא ביטחון לאומי".
התגלית המפתיעה באמת התרחשה בשלב "מטריצת ההצלבה". הזנתי טקסטים של מחוקקים דמוקרטים לתוך המודל שאומן על רפובליקנים, ולהפך. באופן מדהים, המודלים כמעט לא הופתעו. הסטייה עמדה על פי 1.15 בלבד מנורמת הבסיס. משמעות הדבר היא שמבחינה מבנית, תחבירית וקצבית - הרפובליקנים והדמוקרטים משתמשים באותו DNA טקסטואלי בדיוק. הממסד הפוליטי, כך מוכיחה הסטטיסטיקה, משטח ומוחק את הקול האישי לטובת פס ייצור של מסרים קבועים.
הכאוס של טראמפ והאי הבודד של מאסק
אל מול הרובוטיקה המפלגתית, בלטו שתי הישויות העצמאיות שנבדקו. דונלד טראמפ קיבל מדד כאוס של 22.3. מבחינה סטטיסטית, טראמפ משמעותית פחות צפוי מהמפלגה שלו. הוא קופץ בין נושאים, משנה מקצבים, ואפילו ממציא מילים.
ההבדל בין "אזור הנוחות" שלו לרגעים שבהם הוא מפתיע את עצמו, ניכר היטב בנתונים:
טראמפ באזור הנוחות (מדד הפתעה: 1.8):
"אתראיין בתוכנית Fox and Friends ב-8:00 בבוקר. תהנו!"
טראמפ מחוץ לאזור הנוחות (זינוק של +100 סטיות תקן):
"פילדלפיה חייבת משקיפי קלפיות!" (במקור הוקלד עם שגיאת כתיב חריגה: Philadelpiha).
שבירת המודל:
כאשר טראמפ צייץ ב-Truth Social את צמד המילים המומצאות "Dumacrats Love Sewage", המילה החדשה גרמה למודל להיכנס לפאניקה סטטיסטית והקפיצה את הציון במאות סטיות תקן מחוץ לסקאלה.

אבל מנצח מדד הכאוס הבלתי מעורער הוא אילון מאסק, ששבר את הסקאלה עם ציון של 37.5 - פי שניים מכל פוליטיקאי ממוצע. אף מודל אחר לא הצליח אפילו להתקרב לפענוח דפוסי הכתיבה של מאסק.
בעוד שטראמפ הוא עדיין פוליטיקאי (גם אם כאוטי), מאסק מתנהל במרחב סגנוני משל עצמו. הפער הזה לא נובע בהכרח מאיזה עומק טקסטואלי, אלא פשוט מפריבילגיה: בניגוד לנבחרי ציבור שמשלמים מחיר כבד על כל ציוץ חריג (ולכן מצנזרים את עצמם כדי לרצות את הבוחרים והתורמים), למאסק אין קואליציה שצריך לשמור עליה. החופש המוחלט הזה מהשלכות פוליטיות הוא מה שמאפשר לו לייצר סגנון קצרצר, תזזיתי, מלא בסלנג אינטרנטי, נטול כל מבנה ממסדי ולגמרי חסין מניבוי אלגוריתמי.
סיכום
היכולת לקחת תכונות אנושיות חמקמקות כמו "טון" או "סגנון", לפרק אותן למספרים ולהציג אותן על ציר, היא קפיצת מדרגה באופן שבו אנו יכולים לנתח שיח פוליטי. המספרים מוכיחים את מה שרבים מרגישים: הפוליטיקה הממסדית הופכת את נציגיה לפקידי טקסט משעממים, ודווקא בגלל זה, דמויות ששוברות את התבנית הסטטיסטית - כמו טראמפ ומאסק - מצליחות ללכוד את תשומת הלב הציבורית והאלגוריתמית פעם אחר פעם. הסגנון האנושי הוא כבר לא בגדר תעלומה, הוא פשוט עוד דאטה-סט שמחכה שיפענחו אותו.
נספח טכני: מתחת למכסה המנוע (למי שרוצה להבין איך זה עובד)
עבור חובבי הדאטה והטכנולוגיה, הנה הצצה קצרה למתודולוגיה שמאחורי הפרויקט:
- המודל (למה לא ChatGPT?): כדי לבודד סגנון אישי, אי אפשר להשתמש במודלי-ענק (LLMs) מודרניים. מודלים גדולים מדי נוטים ל"החלקת סגנון" בגלל כמות המידע העצומה שהם מכילים. לכן, השתמשתי במודל קטן ופתוח - GPT-2 (בגרסת ה-117 מיליון פרמטרים). מודל כזה קל בהרבה לאימון מחדש (Fine-Tuning), והוא "טיפש" מספיק כדי לשכוח את מה שידע קודם ולספוג אך ורק את ה-DNA הטקסטואלי של הפרסונה החדשה שהזנו לו.
- הדאטה: "זבל נכנס - זבל יוצא". הפרויקט דרש ניקוי מאסיבי של הנתונים. מתוך 78,000 ציוצים של אילון מאסק, לדוגמה, סוננו החוצה כ-80% משום שהיו תגובות קצרות (Replies) של מילה אחת ("Wow", "Cool"). הושארו רק ציוצים מקוריים וארוכים מספיק כדי להוות דגימת טקסט משמעותית.
- המדד (Perplexity): כדי למדוד "הפתעה", השתמשתי במדד שנקרא פרפלקסיטי (Perplexity). ברמה המתמטית, המדד בודק מה ההסתברות שהמודל יעניק למילה הבאה במשפט, בהתבסס על מה שלמד באימון. כאשר מודל נתקל ברצף מילים שהוא לא ציפה לו (כמו שגיאת כתיב או חיבור נושאים לא שגרתי), ההסתברות צונחת וציון הפרפלקסיטי מזנק.
- תשתית הפיתוח: באופן מפתיע, אימון 4 המודלים לא הצריך חוות שרתים בענן. כל תהליך האימון (Fine-Tuning) בוצע מקומית על מחשב MacBook Air (עם 24GB RAM), מה שמוכיח שחקר דאטה איכותי בעולמות ה-AI הופך לנגיש מתמיד לחוקרים עצמאיים.
הקוד הדאטה והמודלים בקוד פתוח: https://github.com/Miriam2040/twitter-persona-alm


