אנחנו שומעים הרבה על ה"ישראלי הממוצע" - אותו יצור פלאי המייצג בגופו את הקשת הישראלית על כל גווניה. לישראלי הממוצע יש את ההכנסה הממוצעת; לישראלי הממוצע יש את מספר הילדים הממוצע; אבל הישראלי הממוצע הזה לא קיים. לאף אחד, תודה לאל, אין 2.4 ילדים.
אולי אנחנו לא מתכוונים לישראלי הממוצע, אלא למשהו קצת אחר: הישראלי השכיח, או הטיפוסי, או הנפוץ. אותו אדם שיש הכי הרבה "כמוהו" בישראל. ראינו, למשל, שכבר במקרה של שמות – השם השכיח ביותר הוא מוחמד – אז "מוחמד" הוא האדם בישראל שיש הכי הרבה כמוהו, מבחינת שם פרטי. אז מה זה אומר, "כמוהו"? התשובה לשאלה הזו תלויה במאפיין או מאפיינים שאנחנו בוחרים לבחון. אפשר לסווג אנשים ולשאול מי הכי נפוץ מבחינת גובה, צבע עיניים, הכנסה, מין, רמת דתיות, סוג נעליים מועדף, דעה פוליטית ועוד, וגם מי הכי נפוץ מבחינת השילוב של המאפיינים הללו.
ברשומה הזו, נתמקד ב-10 מאפיינים דמוגרפיים וכלכליים, אותם קיבלנו מנתוני סקר הוצאות משק בית 2017 (העדכני ביותר) של הלשכה המרכזית לסטטיסטיקה – בהשראת הפרק של הפודקאסט המומלץ Planet Money בנושא "האמריקאי השכיח", תחת השינויים המתבקשים למציאות הישראלית לעומת זאת האמריקאית: מין, גיל, לאום, מוצא, רמת דתיות, מצב אישי, השכלה, תעסוקה, צורת מגורים והכנסה.
תיאור טכני של הנתונים
הסקר של הלמ"ס כולל 8,903 משקי בית, המכילים בסך הכל 30,492 נפשות. עבור כל אדם, אנו יודעים הרבה מאוד דברים (כולל עשרת הקריטריונים שרשמנו למעלה), וכל אדם בסקר למעשה "מייצג" כמות מסוימת של אנשים הנאמדת על ידי הלמ"ס ונקראת "משקולת ניפוח". המשקולות נאמדו כך שכמות האנשים המיוצגים בסקר תתאם לכמויות ידועות באוכלוסיית ישראל, למשל של גברים ונשים, יהודים וערבים וכד'. כך, למרות שיש לנו נתונים "רק" על 30,492 איש – הם למעשה מייצגים 8,395,929 איש.
בנתוני הלשכה המרכזית לסטטיסטיקה, מין מחולק לשתי קבוצות: גברים ונשים.
את הגיל נחלק לשכבות בסדר עולה: ילדים (עד גיל 18), מבוגרים צעירים (עד גיל 30), מבוגרים בגילאי העבודה העיקריים (עד גיל 55), מבוגרים (עד גיל 67) ו-ותיקים בגילאי פרישה (67 ומעלה).
מבחינת לאום, הלשכה המרכזית לסטטיסטיקה מסווגת ל-3 קבוצות: יהודי, ערבי ואחר. הקבוצה השלישית קטנה מאוד, ולכן נאחד אותה לשתי קבוצות: יהודי ולא-יהודי.
מוצא מוגדר לפי יבשת הלידה של האדם ושל אביו. אם האדם נולד בחו"ל, המוצא שלו הוא יבשת הלידה שלו. אם הוא נולד בישראל, המוצא שלו יקבע לפי המוצא של אביו. הלשכה המרכזית לסטטיסטיקה מסווגת יבשות לידה ל-4 קטגוריות: אירופה ואמריקה, אפריקה ואסיה, ישראל ולא-ידוע.
רמת דתיות נמדדת על ידי השאלה "מהו אורח החיים העיקרי מבחינה דתית של האנשים השייכים למשק הבית", והאפשרויות הן חילוני, מסורתי, דתי, חרדי, אורח חיים מעורב ואחר. את "אורח חיים מעורב" ו-"אחר" נקבץ יחד, כך שיש לנו עכשיו 5 קבוצות: חילוני, מסורתי, דתי, חרדי ואחר.
מצב אישי מחולק במקור לארבע קבוצות: רווקים, נשואים, גרושים, אלמנים. כמו במקרה של לאום, שתי הקבוצות האחרונות קטנות יחסית ולכן נאחד אותן לשתי קבוצות: נשוי ולא-נשוי.
השכלה ניתן למדוד במגוון דרכים – שנות לימוד, התעודה הגבוהה ביותר, מקצוע התואר (אם יש תואר) וכו'. גם כאן, בשביל להימנע מקבוצות מאוד קטנות, איחדנו את הקטגוריות לשתי קבוצות: מי שיש להם תואר אקדמי (ראשון ומעלה) ומי שאין להם.
את תחום התעסוקה בחרנו לחלק גם כן לשתי קבוצות בלבד – מועסק ולא מועסק. יכולנו גם להתחשב בהיקף התעסוקה (משרה מלאה לעומת חלקית) או בסיבה לאי תעסוקה (האם מובטל או שכלל לא מחפש עבודה), אבל גם כאן מדובר בקבוצות קטנות שעדיף לאחד.
בשביל צורת מגורים השתמשנו ב"מדד הפריפריאליות" של הלשכה המרכזית לסטטיסטיקה. המדד מסווג כל ישוב על בסיס שני מרכיבים. הראשון: נגישות פוטנציאלית לעבודה, לימודים, קניות, פנאי ועוד; השני: הקרבה לגבול מחוז תל-אביב, שהוא הבירה החברתית-כלכלית של ישראל. לפי המדד הזה, אילת היא הישוב הפריפריאלי ביותר בעוד שגבעתיים (ולא תל-אביב! אבל אין ביניהן באמת הבדל בנושא הזה) היא הישוב המרכזי ביותר. את המדד חילקנו ל-3 קבוצות: פריפריאלי, בינוני ומרכזי. לפי החלוקה הזו, ירושלים וחיפה שתיהן "מרכזיות", באר-שבע ואשקלון הן "בינוניות" ואילת ונהריה הן "פריפריאליות".
אם נדבר על מאפיין שיש לו הרבה מאוד אפשרויות, כמו הכנסה – אנחנו נכנסים לבעיה קטנה, שבה לכל אדם יש הכנסה קצת שונה, ואז מישהו שהכנסתו 10,001 ₪ לחודש ומישהו שהכנסתו 9,998 ₪ הם לא באותה קבוצה, למרות שברור שהדרך הטובה ביותר לאפיין את ההכנסה שלהם תהיה "באזור 10,000 שקלים". אז במקום להסתכל על הכנסה בשקלים, נסווג את סך ההכנסות החודשית של משק בית לקבוצות (נטו = ההכנסה מכל המקורות, כולל קצבאות, ובחיסור מיסים): פחות מ-10,000, בין 10,000 ל-20,000, בין 20,000 ל-30,000 ו-30,000 ומעלה.
התוצאות
אחרי ההקדמה הקצת ארוכה והטכנית הזו, בואו ניגש לתוצאות. לכל מאפיין או תכונה בנפרד, אפשר למצוא יחסית בקלות את השכיח. אם נשאל, למשל, מה יותר שכיח בישראל – גברים או נשים, נגלה שיש יותר נשים (4.268 מיליון) מגברים (4.128 מיליון), ולכן הישראלי השכיח הוא אישה:
מבחינת רמת דתיות, הישראלי השכיח הוא חילוני – 3.174 מיליון:
מבחינת תעסוקה, הישראלי השכיח אינו מועסק:
עכשיו, נניח שהיינו מסתכלים על שלושת המאפיינים (או "מימדים") האלה בלבד. האם יהיה נכון לומר שהישראלי השכיח הוא אישה חילונית שאינה מועסקת? בוודאי שלא! אי אפשר פשוט "לחבר" כך תכונות. ברגע שאנחנו יודעים משהו על מישהו, אנחנו למעשה יודעים עליו יותר מזה. כפי שהראנו ברשומה "כמה תשובות" – ברגע שאנחנו יודעים אם אנחנו בלונדון או בת"א, באוגוסט או בינואר, אנחנו גם יכולים להעריך באופן לא רע אם יהיה גשם או לא. הדברים הללו תלויים זה בזה – ומה שנכון למזג אוויר נכון גם למאפיינים אנושיים חברתיים.
אם היינו מסתכלים, למשל, על שם פרטי ועל מין בלבד היינו, כביכול, מקבלים תוצאה בה הישראלי הטיפוסי הוא אישה ששמה מוחמד. מדוע? אנחנו יודעים שיש יותר נשים מגברים, וגם שמוחמד הוא השם הפרטי הנפוץ ביותר בישראל. אך ברור לנו, הרי, שהישראלי השכיח הוא לא אישה בשם מוחמד – כי ברגע שאנחנו יודעים שמישהי היא אישה, הסיכוי שהשם שלה הוא מוחמד יורד לאפסי כמעט וכך גם הפוך – מה הסיכוי שמישהו שאנחנו יודעים שקוראים לו מוחמד הוא אישה?
במקרה שלנו, ויש לזכור שאנו מתחשבים כעת בשלושה מאפיינים (מין, תעסוקה ורמת דתיות): שיעור התעסוקה של גברים גבוה יותר משל נשים, וכך גם שיעור התעסוקה של חילונים גבוה יותר משל הקבוצות האחרות. הישראלי השכיח, על פי שילוב שלושת המאפיינים הללו, הוא דווקא גבר חילוני מועסק.
נחזור לעשרת המאפיינים המקוריים שלנו ונסווג כל אדם לפי מיקומו על פני כל אחד מהם. שימו לב שכבר עכשיו, נוצרת חלוקה ענקית: מספר הקבוצות הסופי הוא מכפלת מספר הקטגוריות בכל מאפיין. במקרה שלנו, אפילו אחרי שצמצמנו כל מיני מאפיינים למספר קטן של קטגוריות, נשארנו עם 38,400 (!) קומבינציות שונות של המאפיינים. עכשיו, כל מה שנותר לנו לעשות הוא לספור את מספר האנשים בכל קומבינציה כזו. תוכלו לנחש מי הקבוצה הגדולה ביותר?
בגודל של 111,563 איש (1.3% מהאוכלוסייה) מדובר ב...ילדים! ליתר דיוק: ילדים, זכרים, יהודים, חילונים ממוצא ישראלי, לא-נשואים, לא-אקדמאיים, לא-מועסקים, גרים בישוב מרכזי וחיים במשק בית עם הכנסה של 30,000 ₪ נטו בחודש ומעלה:
מדוע זה קרה? מאותה הסיבה שאין נשים ששמן הוא מוחמד. חלק גדול מהמאפיינים שבחרנו לבחון הם שאלות למבוגרים – השכלה, תעסוקה ומצב אישי. השאלות הללו פחות רלוונטיות לילדים, ולכן חלק גדול מהם מתקבץ לתוך הקבוצות שהן ללא השכלה אקדמית, לא נשואים ולא מועסקים. במילים אחרות – אם אתם רואים מבוגר ברחוב, אתם יכולים לתהות אם יש לו תואר או לא, אם הוא עובד או לא – אם אתם רואים ילד, סביר להניח שאלו בכלל לא השאלות שיעלו לכם לראש.
אז בואו נשנה קצת את השאלה – במקום מיהו הישראלי השכיח, נשאל מיהו הישראלי המבוגר השכיח, ונשים לרגע בצד את הילדים. במקרה הזה, אנחנו מקבלים תוצאות קצת יותר מעניינות:
הישראלי המבוגר השכיח (על פני עשרת המימדים שבחרנו לבחון) הוא: אישה בת 30 עד 54, יהודית חילונית ממוצא אירופאי או אמריקאי, נשואה, בעלת תואר אקדמי, מועסקת, גרה בישוב מרכזי וחיה במשק בית (ובניגוד לילדים, מוסיפה להכנסתו) עם הכנסה של יותר מ-30,000 ₪ נטו בחודש. שימו לב שהקבוצה הזו מכילה רק 38,693 נשים – 0.6% בלבד מהאוכלוסייה המבוגרת בישראל.
אז האם זהו באמת "הישראלי(ת) הטיפוסי(ת)"? מצד אחד, אם נחזור להתחלה, זו בכל זאת תשובה טובה יותר לשאלה "מיהו הישראלי הטיפוסי" מאשר "הישראלי הממוצע", שיש בדיוק 0 כמוהו.
אבל בעצם, התרגיל הקטן הזה מראה לנו שברגע שאנחנו רוצים לדעת "מי הכי נפוץ" על פני יותר ממספר בודד מאוד של מאפיינים – זה תרגיל אפשרי, אבל מעט מיותר. כמות הקבוצות כ"כ גדולה, שאף קבוצה לא יכולה להיות באמת מספיק גדולה כדי שניקח אותה ברצינות כמייצגת את הישראלי הנפוץ. למעשה, עדיף לצמצם את מספר המאפיינים שאנחנו בוחרים לבחון, ולא להרחיב אותו. לפעמים יותר זה פחות.
למעוניינים: הקוד ב-R שאיתו ביצעתי את החישובים ויצרתי את התרשימים נמצא כאן כדף HTML: https://akarlinsky.github.io/modal_israeli/Main-RMD2.html
נוסף על מה שנאמר בנוגע לשימוש חציון היכן שניתן, למה לא לנקוט בגישה אחרת: לבנות 'מסלול' לאדם הטיפוסי דרך המסננות של הקטגוריות השונות, לפי סדר שייקבע בצורה כלשהי במטרה להביא לאחת מ-38,400 הקומבינציות שתהיה הנכונה ביותר. נראה לי שסדר אפשרי יכול להיות לפי כמה 'מובהקות' יש בקטגוריה והיא תימדד כפער בין הקבוצה הגדולה לזו שאחריה. הפער בין מספר הגברים למספר הנשים נמוך ואילו הפער בין מספר היהודים למספר הלא-יהודים גבוה. לכן, היותו של הישראלי המצוי יהודי 'מובהקת' יותר מהיותו אישה. אין לי את המספרים של כל הקטגוריות אבל מהמספרים שמצאתי הסדר הוא כזה: לאום, תעסוקה, מצב אישי, מוצא, גיל, הכנסה, דתיות ואז מין. כך שאם שואלים אם הישראלי המבוגר הנפוץ יהודי התשובה היא כן, והיהודי הנפוץ מועסק, והיהודי המועסק הנפוץ…
בקריטריונים שיש בהם סקאלה מוגדרת, גם אם בדידה, לא עשוי להיות מעניין יותר להסתכל על הישראלי החציוני? אני חושב שזה עונה יותר לתפיסת ה׳ישראלי האמצעי׳ שרוב האנשים חושבים עליו. אם, למשל, נסדר את היהודים לפי מידת דתיות (וללא ה׳אחרים׳), נקבל שהחציוני הוא מסורתי. לדעתי, יותר מכל זה מה שאנשים חושבים עליו בהקשר של ׳ישראל ישראלי׳ - זה שחצי משתכרים יותר ממנו וחצי פחות ממנו, חצי דתיים יותר ממנו וחצי פחות ממנו וכו׳. בקריטריונים שאי אפשר לסדר על סקאלה (דת) או בכאלה שיש להם רק שתי אופציות (גבר/אישה) זה כמובן לא יעזור, אבל לפחות בחלק מהמקומות אני חושב שכך יתקבלו תוצאות שיותר תואמות את התפיסה הקולקטיבית של ׳ישראל ישראלי׳.