יום חמישי, 7 בפברואר 2019

מודלים מנטליים של עוזרים אישים ולמה כדאי להכיר אותם.





אם אתם מפתחים מערכות שמשתמשות בבינה מלאכותית ( AI או ML), כדאי לכם להבין היטב איך המשתמשים תופסים אותן. זה יעזור לכם לייצר מערכות טובות יותר ולתת מענה טוב יותר לצרכים של קהלי היעד.  ההבנה כזאת תעזור לכם לפתחו מודל אינטראקציה, שמשתמשים יבינו בקלות וידעו להתנהל בו. חשוב להבין שאתם לא "מתחילים מאפס" כי להרבה מאוד קהלי יעד כבר יש הבנה מסויימת בנוגע למוצרי AI, היות והם כבר התנסו בהן. להבנה הזאת אנחנו קוראים "מודל מנטאלי".
נתחיל מלהסביר ש"מודל מנטלי" הוא מונח מתחום המדעים הקוגניטיביים שמשמעותו, בלי לסבך יותר מידי, היא תמונת העולם הפנימית הסוביקטיבית שיש למשתמש ביחס למערכת אותה הוא מפעיל.  זהו כלי הישרדותי שמאפשר לנו להתמודד עם מנגנוני העולם – אנחנו יודעים שכאשר אנחנו לוחצים על דוושת התאוצה, הרכב שלנו מאיץ; ושכאשר אנחנו לוחצים על הבלם, הרכב מאט.  אין לנו אפשרות (ובד"כ גם לא רצון) להכיל ידע מסודר ו"אמיתי" על כל מה שקורה ברכב בדרך לביצוע הפעולות הללו.  כלומר, כדי להפעיל רכב, וכדי לנהוג בו, אנחנו נדרשים להבנה מאוד מְפוּשָׁטֶת בנוגע אליו – סך כל ההבנה הזאת הוא ה"מודל המנטאלי" שלנו ביחס לרכב.  הראש שלנו מלא במודלים מנטאליים כאלה בנוגע לכל מוצר או שרות שאנחנו משתמשים בהם.
בקבוצת המחקר Nielsen Norman Group יצאו לבדוק את המודלים המנטאליים של משתמשים ביחס ל"עוזרים אישיים" (Intelligent Assistants) או "עוזרים דיגיטליים" שקיימים היום בשוק.  הם מצאו שלושה מודלים עיקריים.
(1) העוזר הדיגטלי הוא ממשק ל"משהו אחר" (אינטרנט, ספר טלפונים, ויקיפדיה, אמזון וכו').
(2) העוזר הדיגיטלי הוא עוזר שימושי ויעיל – מין סוכן או עוזר אישי, שעושה דברים במקומך, ומפשט לך את החיים.
(3) העוזר הדיגיטלי הוא מחסן של ידע – חכם יותר מאנשים, יודע דברים, או בעל גישה להרבה מאוד מידע.
הם גם גילו שמשתמשים התרשמו מכך שהעוזרים הדיגיטליים התקשו להבין שאלות או מטלות שהוקצו להם; שיש לדבר איתם בצורה מאוד ספציפית (לא להותיר עמימות); שלא תמיד הם מספקים תשובות נכונות; שהם מתקשים להבין הוראות מורכבות בשלבים ולנהל שיחה; שבתנאים מסויימים הם מציגים אתר אינטרנט, במקום להשיב בעל־פה; שהם מתקשים לזהות הֶקְשֵׁרים ורמזים לא מפורשים; ושהם לא מגישים למשתמשים עזרה ביחס לאופן ההפעלה שלהם.
אז אם אתם מפתחים מוצר AI (או מוסיפים תכונות חדשות למוצר קיים),  (1) בדקו את המוצר במשימות ריאליות עם נבדקים דומים ככל האפשר לקהל היעד, (2) וקחו בחשבון שאם אתם חושפים את קהל היעד למוצר שהביצועים שלו לא מספיק טובים, זה עלול לגרום להם לגבש דעה שיהיה קשה מאוד לשנות בהמשך - מי שיתיאש יהיה קשה מאוד להחזיר אותו להתנסות חוזרת עם מוצר משופר.

יום ראשון, 28 באוקטובר 2018

מסתבר שגם אצל סירי החזות קודמת לקול






בניגוד לדעה הרווחת, לפיה בזכות ההתקדמות הטכנולוגית, לא ירחק היום שבו נוכל לשוחח בטבעיות עם מחשבים ומערכות בינה מלאכותיות  - המציאות מוכיחה שאנחנו אפילו לא קרובים לזה!  נכון לעכשיו אנחנו עוד לא באמת יכולים לשוחח ברצינות עם המחשבים שלנו.

ממשקי השיחה המשוכללים ביותר, שכבר נגישים לצרכנים, הם העוזרים האישיים הדיגיטליים, דוגמת סירי של אפל, אלקסה של אמזון והעוזר של גוגל (OK Google). בפועל המוצרים הללו די מוגבלים מבחינת היכולת שלהם לפענח את הכוונה של המשתמשים ומבחינת היכולת שלהם להגיש למשתמשים את המידע באופן יעיל. במאמר שפורסם ביולי 2018 באתר של חברת היעוץ והמחקר Nielsen Norman Group מתארים הכותבים סידרה של מבחני שמישות, שהם ערכו לעוזרים הדיגיטליים.  מסתבר שהמוצרים הללו עדיין מתקשים מאוד לנהל שיחה טבעית ולזהות את מצב העניינים. לפעמים נדמה כאילו הם ממשיכים לדבר ולהגיש את התוצאות לנצח – גם כשהמשתמש כבר מזמן איבד עניין, או הפסיק לעקוב.  בנוסף לזה, מסתבר שבהרבה מאוד מקרים עצם הקראת תשובות לשאלות של משתמשים מקשה על המעקב אחר התשובות – למשל כאשר המערכת מציעה מספר אפשרויות לבחירה.  עוד עולה מן המחקר כי העוזרים הדיגיטליים מתקשים לזהות שאלות המשך, שמתבססות על התשובות שנתנו, ושהם מתקשים לזהות את ההֶקשֵׁר של השיחה, באמצעות מידע זמין מהיומן של המשתמשים, או מהתכתבויות הדוא"ל שלהם.  כדי למצות את היכולות של העוזרים, המשתמשים צריכים למעשה ללמוד איך לדבר איתם נכון ובאילו מונחים להשתמש – כלומר, בשלב זה לא מדובר באמת בשיחה טבעית אלא בהליך שמצריך למידה והסתגלות של המשתמשים.

על רקע קשיים מובנים אלו ביכולות של העוזרים הדיגיטליים, אנשים נוטים להשתמש בעוזרים בהקשרים מאוד מסויימים לביצוע משימות פשוטות יחסית. המניעים העיקריים לפנייה לעוזר דיגיטלי הם מצבים בהם הידיים תפוסות (כמו למשל בזמן בישול או נהיגה) והצגת שאלות שיותר מהר לומר אותן בהשוואה להקלדה וקריאה של התשובות (כלומר שאלות פשוטות יחסית). לרוב האנשים, שמשתמשים בעוזרים, יש אמון מוגבל למדי באשר ליכולותיהם ולרוב הם יציגו שאלות פשוטות בסיגנון של מי, מה, מתי, איפה, ולא שאלות של בדיקות מעמיקות או חיפושים מעט יותר מורכבים.  גם משתמשים שמצליחים, בסופו של דבר, לשאול את העוזרים שאלות יותר מורכבות ולקבל תשובות ראויות, מרגישים שהמאמץ הכרוך בניסוח מתאים של השאלות, כדי שהעוזר הדיגיטלי יבין אותן, לא משתלם.

היכולת של העוזרים הדיגיטליים לפענח בצורה אינטליגנטית בקשות של משתמשים, ולעבוד עבורם באופן עצמאי (כמו למשל לתאם פגישות או לספק מענה על חלק מהודעות הדוא"ל) דורשת קיום אלגוריתמים, שלומדים את המשתמש הספציפי, באופן מעמיק ולאורך זמן ומבצעים ניתוח מעמיק של ההרגלים שלו ופיענוח נבון של צרכיו – כפי שהם באים לידי ביטוי בבקשה המילולית מהעוזר הדיגיטלי. לכך יש להוסיף כמובן את העובדה שהאינטגרציה של היכולות החלקיות שכבר קיימות, ביחד עם האזנה לפנייה קולית של המשתמשים, עיבוד ראוי של השיחה והקראה של המענה, תוך התחשבות בצרכים במקום ובזמן, עדיין מתנהלים באופן לא מרשים ולא אטרקטיבי.

אז לאן כל התחום הזה הולך?  כנראה שאנחנו נדבר אל המחשבים שלנו יותר ויותר, כי הם יודעים להקשיב ועם הזמן הם ידעו לפענח טוב יותר את הכוונות שלנו.  באשר להגשת מידע מהמחשב אלינו, תשובות פשוטות אפשר להציג באמצעות הקראה, אבל ככל שהדברים מורכבים יותר, יהיה צורך להשתמש בתצוגה חזותית, שמאפשרת סריקה והתמקדות ודורשת פחות ריכוז ופחות מאמץ מנטלי.  בהרבה דברים הערוץ החזותי שלנו הרבה יותר יעיל מהערוץ המילולי: כאשר אתם צריכים לבחור פריט אחד מבין חמישה פריטים, קל יותר להצביע על הפריט הנבחר מאשר להסביר לאיזה פריט אנחנו מתכוונים.  חשבו על שיחה לא במובן של שיחה מילולית בין שני אנשים שהידיים שלהם קשורות אלה על שיחה בה כל צד משתמש באמצעי ההמחשה שעומדים לרשותו – למחשב יש צג והוא יכול לשלב אותו בשיחה כדי ליעל אותה.