בכל רגע נתון

הדאטה ניוזלטר של רועי ומירב

גיליון 5 - אוקטובר 2021

הירשמו לניוזלטר בקישור

עברו להם חודשיים מאז שהוצאנו את הניוזלטר האחרון, ומבטיחים שהייתה לנו סיבה טובה. מירב שועטת במעלה הדוקטורט שלה וגם מתמחה כדאטה סיינטיסט בקבוצת החינוך של מיקרוסופט. אני, רועי, ניצלתי את ההפוגה בין השנים האקדמיות להתרענן, לשמוע המון ספרים במהירות כפולה וללמוד כמה דברים חדשים (שלוש המלצות ולינקים - בסוף הניוזלטר). 

 

אירוע משמעותי נוסף קרה לי בשבוע שעבר - השתתפתי בכנס הפרונטלי הראשון שלי מזה שנתיים (שנתיים של פגישות בוידאו, מי היה מאמין). את כנס Hayadata ארגנה חברת Riskified. פגשתי המון חברים ותיקים מהתעשייה, העלינו זכרונות מהעידן שבו היינו נוסעים לכנסים באירופה וארה״ב כעניין של השגרה, כשהיינו נפגשים במשרדים ואוכלים ארוחת צהריים יחד. היה נפלא להפגש עם כל כך הרבה חברים מהתעשייה שהכרתי בעידן העבודה שלי ב-Outbrain, ולהבחין ב-DNA המשותף שאנו חולקים ושנחרט בנו עד היום. רבים מאיתנו עברו לחברות מעולות אחרות, הקימו סטארטאפים, חלק הנפיקו את החברות שלהם, חלק עובדים עדיין ביחד במסגרות חדשות וחלק נשארו באאוטבריין וסוגרים בה למעלה מעשור. אני אוהב לשלב בין עבודה וידידות (אגב - מרבית המנחים באקדמיה נהיים חברים של הדוקטורנטים שלהם). הכנס הזה הזכיר לי כמה קשה ליצור חברויות חדשות ארוכות שנים בעידן הריחוק החברתי, ועד כמה תפקידו של מנהל ארגון לחשוב כל הזמן על דרכים חדשות ליצירת ושימור DNA ארגוני.

 

מירב ואני הכרנו בזמן עבודה משותפת (למען הדיוק - דרך מכר משותף באקדמיה שהמליץ עליה) ואת הניוזלטר הזה החלטנו להרים תוך כדי צעידה משותפת. את שי פרץ, מנהל הפיתוח של ריסקיפייד - הכרתי עוד בימי צעירותי באאוטבריין, כשארגון התשתיות שלו הציל אותי שוב ושוב מלשבור דברים שדאטה סיינטיסט לא היה אמור לגעת בהם בתקופה ההיא (עוד על כך בהמשך).

בתמונה - חברים ותיקים חושבים על ניוזלטר חדש

בחזרה לעולם הדאטה - מסרים מרכזיים מההרצאה שנתתי בכנס:

 

היסטורית - מקצועות הדאטה היו מחולקים בעיקר בין מדעני נתונים, אנליסטים ומהנדסי דאטה. ועם זאת - הכלים המתקדמים שחברות הענן (אמזון, גוגל ומייקרוסופט בעיקר) נותנות היום - מאפשרים כמעט לכל אחד לשלוף מהקופסה מודלים מתקדמים, להזרים ביג דאטה למערכות המשרתות משתמשי קצה, אם רק ידע האומן קצת פייתון ועבר מספר קורסים על שירותי הענן הספציפיים הללו (אגב - הדבר ממש לא מבטיח תוצאות עסקיות, רק מבטיח יכולות שפעם היו שמורות למעט אנשים וחברות). כל אלא מפנים זמן. במקום לעסוק כל היום בניבוי וכתיבת קוד - דאטה סיינטיסט צריך בנוסף לעסוק באפיון בעיית המשתמש, הגדרת המטריקה לשיפור, ורק אז - אופטימיזציה של מודל וניטורו לאורך זמן.

 

הדבר מביא למספר מגמות מאוד ברורות:

 

  1. מקצועות הדאטה הופכים לפחות מובחנים, והרבה יותר בינתחומיים. חברה לא יכולה יותר להפריד בין ה״חושבים״ (מעין ״מדענים״ שיושבים במגדל השן ומפתחים מודלים סטטיסטים ותיאוריות) לבין ה״בונים״ (מהנדסים שמביאים את אותם מודלים מופלאים לפרודקשן ואחראים לשרברבות של הדאטה). 
  2. הנקודה הקודמת מדגישה את החשיבות של אימוץ סטנדרטים דומים וצורות עבודה דומות בין מקצועות הדאטה השונים (שיטות מחקר, אופן הדיווח והלמידה הארגונית צריכות להיות דומות לאנליסטים, מהנדסים ודאטה סיינטיסטים). לא פחות מכך - חשובה האופרציה של הדאטה של החברה (Operations). 
  3. ככל שלמידת מכונה מיושמת יותר - מדעני דאטה ואנליסטים צריכים לחשוב על הדינמיקה ארוכת הטווח (כמו כלכלנים) של המוצר ולפתח את גרף הידע של החברה (הרצאה מרתקת של סוזן את׳י, חלוצת התחום הכלכלי בנושא). חברה מאמצת מודל -> הוא משפיע על משתמשים -> הם מעדכנים את התנהגויותיהם וציפיותיהם -> החברה צריכה ללמוד ולפתח הלאה. גרף ידע אמיתי ושימושי - נראה כמו שרשרת חיצים של סיבה ותוצאה (על הספר The Book of Why של יהודה פרל כבר המלצנו).
  4. באמצעות מודלים טובים יותר מאלו שיוצאים מהקופסא - אפשר לשפר את ביצועי המוצר בעשרות אחוזים. לעומת זאת, באמצעות תובנות המגיעות מניתוח הדינמיקה של המשתמשים עם המוצר, ובתוספת אינטראקציה עם ״דאטה קטן״ (חוקרי חווית לקוח) - אפשר להביא לשיפור של מאות אם לא אלפי אחוזים בביצועי המוצר ובדינאמיקה ארוכת הטווח אל מול המשתמשים.
  5. מגמה מאוד בולטת מהשנה האחרונה - הינה הנטייה לעבור לפרדיגמת ה-Data Mesh, מעין סוג של Data Marketplace שבו כל איזור במוצר אחראי על הדאטה שלו מקצה לקצה, ומציע את מרכולתו לכל החברה. אני אדבר על כך עוד המון בהמשך, וכיצד הדבר מצריך שינויים ארגוניים ואימוץ טכנולוגיות אחרות במקרים מסוימים. בסופו של דבר - המגמה הזאת מדגישה כי אנשי הדאטה אחראים ליצור ״שגרירי דאטה״ בכל רחבי הארגון. כלומר - להנגיש כלים שמאפשרים לכל אחד בארגון להיות חוקר, מבלי לדעת SQL, תוך יכולת להפריד בין דשבורדים לצורך ניטור לעומת דשבורדים לצורך מחקר.

 

מי שמכיר אותי או למד קורס או שניים שלי - יודע שהכל מסתכם בסופו של דבר במשפט אחד:

 

Data practitioners must have their skin in the game

 

בנית מודל? תכניס אותו לפרודקשן ותדאג לטפל במקרים שבהם הוא נשבר. שלחת מייל או כתבת מצגת עם תובנה מהנתונים? תן לאנשים אחרים להביע ביקורת ולצטט אותך. מנהל מוצר ביקש ממך לבנות דשבורד? כדאי להבין קודם האם הוא הולך להשתמש בו ולמה הוא לא יכול לבנות אותו בעצמו.

כמובטח שלושה לינקים לתכנים סופר מעניינים ועדכניים שאני ממליץ עליהם לאחר ההפוגה:

 

  1. לאלו מכם המפלרטטים בין אקדמיה לתעשייה - אני ממש ממש ממליץ על הפודקאסט של לקס פרידמן מ-MIT. בכל שבוע - הוא מארח את החוקרים המובילים בעולם (כולל דניאל קהנמן לשיחה עם דיפ לרנינג, אנדרו נג לשיחה על חינוך, ורבים נפלאים אחרים) ויחד הם מדברים על נושאים שבתפר שבין מחקר מדעי ליישומים בתעשייה - לינק לפודקאסט.
  2. ציינתי כבר את החשיבות של שיתוף פעולה בין מייצרי חווית לקוח, מעצבים ואנשי דאטה? הנה ניוזלטר מהנה ו-ויזואלי מאוד, שבכל חודש בוחר חברה אחרת, מנתח את ממשק המשתמש שלה, ואת רכבת ההרים הרגשית שהאפליקציה מעבירה את המשתמש המצוי. החודש - הם ניתחו מגה-יוניקורן חביב מאוד עלי - Hopper. גם שירות מדהים, ויש לי גם קשר אישי לאחת מהמנהלות הבכירות והמוכשרות בחברה - לינק לניתוח.
  3. בונים אגם דאטה? תתרגלו למונח חדש (לא כזה חדש כבר) - ״דאטה מש״ - Data Mesh - לינק לאחד מהמאמרים החלוציים בתחום ניהול הנתונים.

מכירים מישהו שיכול להתעניין בנו? נשמח לשיתוף!

הישארו מעודכנים והרשמו לניוזלטר בקישור

בכל רגע נתון, בכל יום תובנה

יש לכם שאלה עסקית מעניינת בנוגע לדאטה?

בכל ניוזלטר נפרסם שאלות והתייעצויות שלכם - מלאו את הטופס ואנחנו מבטיחים לענות על השאלות שלכם 

ד"ר רועי ששון - מרצה כבר 15 שנה במרכז הבינתחומי ובאוניברסיטת תל-אביב לקורסים בתחום האקונומטריקה וביג דאטה. בעל דוקטורט באקונומטריקה, ובעל שנות נסיון רבות בתעשייה הטכנולוגית.

מירב מופז - דוקטורנטית להנדסת תעשיה באוניברסיטת תל-אביב. מבצעת מחקר בתחום של רפואה מותאמת אישית ומתרגלת קורסי תואר ראשון במימון ובמבוא להנדסת תעשיה, עליהם זכתה באות הערכה מטעם הרקטור להצטיינות בהוראה. בעבר עבדה כאנליסטית הונאות בקבוצת ה-Data Science ב-Waze וכיום עובדת כ-data scientist ב-Microsoft Education. 

 

** הדעות המוצגות בניוזלטר הן דיעותינו האישיות בלבד **

This email was created with Wix.‌ Discover More