מדריך זה דן ב- Business Intelligence (BI). BI היא תחום בטכנולוגית המידע, העוסק בהפקת מידע משמעותי מתוך מכלול הנתונים בארגון ומחוץ לארגון המטייב קבלת החלטות עסקיות.
מדריך זה מסביר את התפיסה והטכנולוגיה ואת ההיבטים המעשיים הנגזרים מהן ומתייחס למשמעויות שלהן בהקשר לנוהל מפת"ח.
השורה התחתונה של Business Intelligence (BI) היא ביצוע פעולות עסקיות. ביצוע זה מבוסס על מידע ממוחשב ועל תהליך של עיבוד המידע (לוגיקה עסקית, כללים עסקיים). משורה תחתונה זו נגזרה גם המילה Business המהווה חלק משמו של BI.
לא כל פעולה עסקית המתבססת על מידע ממוחשב ועיבודו היא BI. ביצוע פעולות במערכת טרנזקציונאלית כלשהי (תשלום לרשויות, משיכת כסף במכשיר בנקאי אוטומטי, תשלום לפוליסת ביטוח וכיו"ב), עונה על ההגדרה לעיל ובכל זאת, מערכת טרנזקציונאלית אינה מערכת BI. על מנת שמערכת או חלק ממערכת יענו על ההגדרה של BI, נדרש גם מרכיב של בינה או Intelligence באנגלית.
נדגים זאת באמצעות מערכות מחשוב של חנות ספרים מקוונת.
האם יש בינה בביצוע טרנזקציה של הזמנת ספר בחנות מקוונת?
ייתכן שהלקוח הזמין ספר מצוין בתחום עיסוקו המקצועי, שלאחר קריאתו יעזור לו להגדיל את מעגל לקוחותיו. ייתכן שהלקוח הזמין ספר נפלא על שווק ומכירות, שכתוצאה ממנו ישווק טוב יותר את העסק שלו ויגדיל את מחזור עסקיו. ייתכן שהלקוח קנה ספר מעולה בתחום העניין של לקוח חשוב שלו, על מנת לתת לו אותו כמתנה ולהגדיל את היקף עסקיו איתו.
בכל הדוגמאות לעיל יש בינה.
ייתכן גם שהלקוח רכש ספר מקצועי כושל או ספר גרוע על שווק ומכירות, שידרדרו את עסקיו. ייתכן שספר המתנה ללקוח שלו, אינו ספר ראוי והלקוח הנעלב יפסיק את עסקיו איתו.
בכל הדוגמאות הנ"ל חסרה בינה.
מה שאין ספק הוא, שאם קיימת בינה, היא אינה חלק מהמערכת הממוחשבת ולפיכך זו אינה מערכת BI.
מערכת אחרת של אותה חנות מקוונת עשויה לזהות, שלקוח מסוים הזמין במשך שלוש שנים רצופות, ספרים באותו נושא. בכל הפעמים תאריך רכישה של ספר היה סמוך ליום הולדתה של רעייתו.
המערכת מוציאה הודעת דואר אלקטרוני אוטומטית ללקוח מעט לפני יום הולדתה של רעייתו ובה הצעה לרכישת ספרים, שכולם עוסקים באותו נושא. מערכת זו היא מערכת BI. המערכת הסיקה, שבהסתברות גבוהה, הספרים נקנו כמתנה ליום ההולדת של אשתו ובהסתברות גבוהה עניינו אותה (שאם לא כן לא היה מדובר בסדרת רכישות) ולכן מבצעת פעולה עסקית של הצעת רכישת ספרים בעיתוי רלבנטי.
המאפיינים של מערכת BI הם:
· משמשת לפעולה עסקית מבוססת החלטה על בסיס מידע ממערכות ממוחשבות
· טווח הפעולה עשוי לנוע מהחלטה אסטרטגית ועד ביצוע פעולה טכנית
· מבצע הפעולה העסקית עשוי להיות גורם כלשהו, שהמידע המוצג לו על ידי המערכת רלבנטי עבורו. הגורם עשוי להיות דרג ניהול או דרג מבצע, עובד ביחידה עסקית או איש מערכות מידע. מבצעת הפעולה עשויה להיות גם מערכת ממוחשבת.
· המערכת מבצעת עיבוד של נתונים על מנת להציג רק מידע הרלבנטי לביצוע הפעולה העסקית. טווח העיבוד עשוי לנוע מפעולות פשוטות, כגון: סינון נתונים לא רלבנטיים או אגרגציה ועד ניתוחי מידע מורכבים ומתוחכמים, כגון: ניתוח קשרים בין נתונים שונים לאורך ציר זמן.
· המערכת מציגה למבצע הפעולה דוח הכולל את הנתונים הרלבנטיים ולפעמים גם דפוסי קשר ביניהם והמלצות לפעולה. הדוח עשוי להיות דוח המכיל מספר מצומצם של נתונים ב- Dashboard או דוח המכיל מספר רב של נתונים וחתכים. הדוח יכול להיות דוח אלפאנומרי פשוט או דוח גרפי מתוחכם. הוא עשוי להיות מוצג על יחידת קצה (מסך מחשב אישי, טלפון סלולארי, מחשב Tablet וכיו"ב) או מודפס. הוא עשוי להיות סטאטי (למשל: במקרה של הדפסה על נייר) או דינאמי כשהנתונים בו מתעדכנים על פי תהליכים עסקיים שמתבצעים.
מקורות אפשריים לנתונים לצורך עיבודי BI הם:
· מחסן נתונים (DWH)
· מחסן נתונים תפעולי
· בסיסי נתונים תפעוליים
· Web
· חיפוש ממוקד BI
· קבצים
· גיליונות Excel
מחסן נתונים מבוסס על תהליך הוצאה Extract)) של נתונים ממקורות נתונים שונים בארגון, כגון: מערכות תפעוליות, גיליונות Excel, מאגרי מידע אחרים, קבצים וכיו"ב. הנתונים עוברים שינויים (Transform) כגון: טיוב נתונים, סיכום, השמטת נתונים, עיבודים על הנתונים, שינויי פורמט וכיו"ב. עיבוד ה- BI נעשה על מידע היסטורי. המידע ב- DWH מעודכן בדרך כלל בעיבודי Batch "כבדים" המתבצעים אחת למספר ימים. למידע נוסף ראו קיט מחסן נתונים במפת"ח. במערכות מודרניות גדל השימוש ב- ,Data Warehouse Appliance כלומר: שילוב של חומרה ייעודית ותוכנת בסיס נתונים.
מאגר זה מכיל נתונים תפעוליים בלבד. הנתונים בו עשויים להיות נתונים גולמיים ולאו דווקא נתונים מסוכמים. הבדל משמעותי בינו לבין מחסן נתונים רגיל הוא תדירות העדכון הגבוהה, כך שהנתונים מעודכנים לזמן אמת או במקרה הגרוע פיגור של עד יום אחד. השימוש בו הוא במסגרת Operational BI.
מקור זה הוא גישה לנתונים בבסיסי נתונים תפעוליים, שבמקרים רבים כוללים מידע טרנזקציונלי. אין תהליך של הוצאת הנתונים וביצוע שינויים בהם. מקור זה מתאים ל- Operational BI.
כמויות המידע הרלבנטי לקבלת החלטות בארגון הנמצאות ב- Web הולכות וגדלות. התוכן עשוי להוות מקור ישיר שממנו נאסף המידע או אפליקציה המופעלת באמצעות Web Services.
משמש כמקור לחיפוש מידע רלבנטי ובמיוחד נתונים לא מובנים. משמש גם לחיפוש דו”חות ועיבודי דו”חות.
מידע רב נמצא בקבצים סדרתיים. מערכות BI עשויות להשתמש בו. באופן ישיר או לאחר העברתו למחסן הנתונים.
ארגונים רבים שומרים ומעבדים מידע עסקי משמעותי בגיליונות Excel. מידע זה משמש לפעמים כקלט לעיבודי BI ישירים או כחלק מתהליך ETL להעברה למחסן נתונים.
מערכות BI מסוגים שונים מפיקות תוצרים שונים:
· דו"חות מובנים
· דו"חות אד-הוק
· לוחות מחוונים Dashboards
· דווחי BI אנליטי
הדו"חות עשויים להיות דו"חות המורכבים מאותיות ומספרים ומגוון רחב של דיווחים גרפיים. דו"חות אלה מתאפיינים בדרך כלל בהפקתם במועדים שנקבעו מראש, למשל: אחת לחודש.
דו"חות אד-הוק אינם שונים מדו"חות מובנים בצורת ההצגה. השוני הוא בכך שהם נועדו לענות על צורך נקודתי שהתעורר בארגון. הצורך בכלי להפקת דו"חות אד-הוק ישירות על ידי משתמשים, נמצא בסקרים בעדיפות ראשונה של משתמשים.
נותנים תמונה תמצית של מידע מורכב ומסובך. התמונה מבוססת על מידע ממקורות שונים ומאפשרת התמקדות בנושאים בהם נדרשת פעולה. ניתן להציג מספר Dashboards זה לצד זה ולקבל תמונה ויזואלית אישית של הנתונים.
התוצרים עשויים להיות מוצגים למסכים, להדפסה וליחידות קצה שונות, למשל: הודעת SMS הנשלחת לטלפון סלולארי על ידי מערכת Operational BI.
חלק מהתוצרים הם תוצרים סופיים בעלי מבנה קשיח בעוד אחרים מאפשרים המשך תחקור באמצעים כגון: Drill Down ו- What If, מיונים, Review Then Query וכיו"ב.
תוכן הדווח (מגמות, דירוג מכירות של מוצרים, ניתוח מכירות, Fraud Detection) ורמת הניתוח (דווחים אנליטיים, ניתוחי תבניות נתונים, ניתוחים סטטיסטיים, ניתוחים על ציר הזמן וכיו"ב) עשויים להשתנות.
בגלל הגידול העצום בכמויות הנתונים, נדרשים מנגנונים מיוחדים לטיפול בנתונים רבים והוצאת נתונים מסוכמים או נתונים אחרים, הרלבנטיים לקבלת ההחלטות ולביצוע פעולות עסקיות. יש הטוענים, שכלי BI מסורתיים אינם מתאימים לטפל ב- Big Data ולכן יש צורך בכלים מודרניים המתאימים לעולם זה. נדיר מאד שניתוח ודיווח BI בכלים מסורתיים מבוסס על כל המידע הרלבנטי. ב- Big Data Analytics, השאיפה היא לבסס את הניתוח על 100% מהמידע הרלבנטי. כאשר משתמשים בכמויות גדולות של מידע, ניתן לזהות יותר דפוסי נתונים ויותר דפוסי קשרים בין נתונים. כמו כן מהימנות התבניות שמגלים עשויה להיות גבוהה יותר.
מודל זה מתאים גם לנתונים לא מובנים. המודל נקרא גם Enterprise Data Warehouse (EDW) ומתאים גם לעבודה במחשוב ענן.
המוצר הנפוץ ביותר בעולם ה- Big Data הוא מוצר קוד פתוח של Apache הנקרא HADOOP. למעשה כמעט כל יצרני התוכנה העיקריים משתמשים ב- HADOOP כבסיס לעבודה ב- Big Data: FaceBook, Yahoo!, IBM, Microsoft, EMC, Amazon ועוד. יוצאת דופן היא חברת Google המשתמשת במוצר שפיתחה בעצמה.
מאפייני Big Data:
· כמויות המידע גדולות מאד. מדובר במידע בסדרי גודל של Tera Bytes או Peta Bytes.
· המידע נמצא בקבצים בעלי מבנים שונים ולא בבסיס נתונים יחסי.
· המידע מבוזר במספר רב של Nodes, העשויים להיות במיקומים גיאוגרפיים שונים.
· המידע מעובד במקביל.
· במקרים רבים שימוש באלגוריתם של Map/Reduce.
חלופה אחרת לטיפול ב- Big Data היא שימוש בבסיס נתונים המשמש כמחסן נתונים. הצורך להתמודד עם כמויות גדולות מאד של נתונים מחייב שימוש בטכנולוגיות המאיצות את מהירות ביצוע שאילתות. מודל זה מתאים לנתונים שניתן לשמור ולעבד בתוך מבנה סטנדרטי של בסיסי נתונים יחסיים. במודל זה נעשה שימוש ברוב המקרים בטכנולוגיות ובתפיסות הבאות:
· Data Warehouse Appliance – צמידות בין חומרה ייעודית לתוכנת בסיס הנתונים
· יכולת עיבוד במקביל של מספר רב של מעבדים המטפלים בחלקים שונים במחסן הנתונים.
· שימוש בזיכרון מהיר לאחסון חלק מהמידע באופן קבוע או לפחות בזמן העיבוד. הכוונה היא למנגנוני Caching עם זיכרון מהיר ולדיסקים אלקטרוניים מהירים (Solid State Disks) המהווים חלק מתשתית החומרה הייעודית.
מוצרים בולטים המשתמשים במודל זה: Teradata, Oracle Exadata, IBM Netezza.
מודל כזה מאיץ את העיבודים משום שהם מתבצעים בזיכרון הפנימי של מחשבים. דוגמא בולטת הוא המוצר HANA.של חברת SAP.
מחשוב ענן תופס בהדרגה מקום מרכזי בטכנולוגיית המידע. התוצאה היא שבארגונים רבים חלק מהמידע הנדרש למימוש מערכות BI אינו מגיע ממערכות בתוך הארגון, אלא ממערכות ב- Public Cloud.
הביטויים הבולטים של זה, בהקשר של BI הם:
· מידע חיצוני למערכות הארגון, שעשוי להיות בענן הציבורי, הופך להכרחי לקבלת החלטות. מקורות מידע רלבנטיים הם שותפים עסקיים, ספקים, וארגונים המספקים מידע עסקי.
· כלי BI המופעלים מתוך הענן כגון: Spotfire של TIBCO. במונחי מחשוב ענן, כלים אלה הם אפליקציות SaaS.
· דווח וניתוח נתונים שמקורם בענן. כמות הנתונים המגיעים מהענן הולכת וגדלה ככל שגדלה כמות המערכות של הארגון מתבצעות בענן הציבורי.
· שימוש בענן כפלטפורמת פיתוח. במונחי מחשוב ענן: PaaS.
ההתקדמות הגדולה בעולם המחשוב הנייד בעידן ה- Smart Phonesומחשבי ה- Tablet לא פסחה גם על BI.
Mobile BI הוא תחום ב- BI העוסק בשימושי ויישומי BI בעולם זה:
· אפליקציות BI המותקנות על המחשב או הטלפון הנייד ומשתמשות במידע הנמצא על גבי המכשיר הנייד. האפליקציה יכולה להיות אפליקציית Client המתחברת ל- BI Server.
· ניתוחי מידע הנעשים על המחשב הנייד או הטלפון הנייד ומשתמשים במידע שהגישה אליו היא באמצעות האינטרנט.
· ניתוחים ופעולות המבוססים על מידע ייחודי למחשב הנייד או הטלפון הנייד. נתון בולט במיוחד הוא המיקום. ההצעות העסקיות המכוונות ללקוח, עשויות להיות תלויות במיקומו. למשל: הצעה לארוחה במסעדה, תהיה למסעדות שבקרבת מקום למקום בו הוא נמצא באותו זמן.
·
מבחינה טכנולוגית קיימים אופני עבודה שונים של מחשב נייד או טלפון חכם מול אפליקציית BI:
· משלוח של מידע סטטי למכשיר הנייד
· התחברות באמצעות Mobile Browser. ההתקדמות הגדולה בטכנולוגיה זו הייתה כאשר ניתן היה להתחבר לרשתות אלחוטיות.
· שני סוגי אפליקציות BI Mobile הנפוצים היום הם: אפליקציית Web ואפליקציית Native. אפליקציות Native הן קנייניות: רובן פועלות תחת מערכת ההפעלה IOS של Apple או תחת מערכת ההפעלה Android.
אפליקציות ה- Mobile BI המתקדמות ביותר מבחינה טכנולוגית מאופיינות על ידי היכולת של אינטראקציה מלאה בין היחידה הניידת לאפליקציית ה- BI. המשמעות היא שבנוסף להודעות SMS והודעות דוא"ל, ניתן לנווט בין Dashboards ולבצע שאילתות אנליטיות עם דיאלוג בין במצע השאילתה והאפליקציה, כלומר: על סמך המידע שהתקבל ניתן להמשיך בתחקור Drill Down.
אינטגרציה עם Microsoft Office מתמקדת במיוחד ב- Excel. Excel הוא מצד אחד כלי שבאמצעותו ניתן לבצע ניתוחים סטטיסטיים ולהציג דווחים, כגון: גרפים של נתונים. מצד שני הוא כלי, שבגיליונותיו עשויים להיות נתונים המהווים קלט לעיבודי BI. בחלק מהארגונים, כמות גדולה של נתונים עסקיים מהותיים עשויה להיות מבוזרת בגיליונות Excel.
רכיב אחר ב- Microsoft Office הוא PowerPoint. בדרך כלל מצגת באמצעותו עשויה להוות פלט של עיבודי וניתוחי BI. גם PDF עשוי לשמש למטרה דומה.
סעיף זה מרחיב כמה מהנושאים המהותיים בבינה עסקית.
כריית מידע או כריית נתונים הוא תהליך באמצעותו מנסים למצוא דפוסי נתונים ולהסיק מהם מסקנות. כריית מידע היא חלק מ- Analytic BI. המושג כריית מידע מדמה את ניתוח הנתונים לעבודה במכרה בו כורים חומר יקר (יהלומים, זהב או אפילו פחם). המטרה בכרייה במכרה היא לדלות את מירב החומר היקר. באופן דומה מנסים בכריית מידע למצות את מירב המשמעויות העסקיות של מידע. בדרך כלל מדובר במידע הנמצא בבסיס נתונים של מחסן נתונים.
דוגמאות לאלגוריתמים שכיחים של ניתוח הנעשה בכריית נתונים:
· רגרסיה ליניארית
באמצעות אלגוריתם זה מנסים למצוא מתאם או קשר ליניארי בין שני משתנים. הנוסחה של רגרסיה ליניארית היא: X=a+bY. כאשר X ו- Y הם המשתנים ו- a ו- b הם מקדמים אותם מנסים לאמוד. כך למשל X יכול להיות ציר זמן ו- Y ההכנסות ממוצר שהחברה מוכרת.
· ניתוח אשכולות (Cluster Analysis)
לדוגמה בנק יכול לנסות לפלח את לקוחותיו לאשכולות לפי הערוצים (סניף, אינטרנט, טלפון חכם, Call Center וכיו"ב) באמצעותו הם מבצעים את מרבית הפעולות, מול הכנסות הבנק מאותם לקוחות. בניתוח כזה מצאו לא מעט בנקים, שלקוחות הפועלים באמצעות אינטרנט הם לקוחות טובים יותר לבנק מאשר לקוחות הפועלים באמצעות סניף. ממסקנה זו, עשויות להיגזר החלטות ופעולות עסקיות.
· סווג (Classification)
אלגוריתם להסקת מסקנות לעתיד על פי ניסיון העבר. כך למשל חברת ביטוח עשויה לדרוש ממעשנים תשלום גבוה יותר לצורך ביטוח חיים. הבסיס לדרישה הוא, שניתוח נתוני העבר מראה כי מעשנים מתים בגיל מוקדם יותר מאשר לא מעשנים ולכן חברות הביטוח משלמות יותר ליורשיהם.
תהליך כריית נתונים מורכב מ- 4 שלבים:
· בניית מאגר הנתונים
· תכנון
· כרייה
· אימות
על מנת שניתן יהיה להסיק מסקנות מהדפוסים הנמצאים בכריית המידע, מאגר המידע צריך להיות מספיק גדול. לצורך כך יש תהליכים של בנייה ועדכון מחסן נתונים. פיתרון חלופי, העונה על הדרישה לכמות נתונים גדולה, הוא שימוש ב- Big Data ללא יצירת בסיס נתונים.
ללא תכנון מראש של הניתוחים שיתבצעו ייתכן כי נתעלם מדפוסים מעניינים שלא ייבדקו.
כשלא מתכננים, ניתן למצוא ממצאים לא תקפים ולהסיק מהם מסקנות שגויות שיביאו לפעולות עסקיות שגויות.
דוגמא: הרצת בדיקות רגרסיה לינארית על מספר רב של זוגות משתנים. בהחלט ייתכן שבגלל תלויות בין משתנים יימצאו באופן מקרי קשרים לא תקפים בין מספר קטן של זוגות משתנים.
בשלב זה מתבצעים עיבודי כריית הנתונים.
לא כל הדפוסים שנמצאים בכריית מידע תקפים מעבר לכמות נתונים חלקית עליה התבצע עיבוד כריית מידע. בשלב האימות מתבצעים אלגוריתמים ממוחשבים, שמטרתם למצוא דפוסים שנמצאו ובכל זאת אינם תקפים.
OLAP הוא סוג של Analytic BI. OLAP מבוסס על ניתוח רב-מימדי. בניתוח רב-ממדי הנתונים מקובצים לשני סוגים:
· מימדים – בניתוח כזה נדרשים שניים או יותר מימדים
· מדידות
דוגמה: מחזורי מכירות של מוצרים במשך מספר שנים. הממדים הם: מוצרים ושנים. מדידה היא מחזור המכירות של מוצר מסוים בשנה מסוימת. בניתוח כזה ניתן לגלות מגמות כמו ירידה במחזורי המכירות של מוצר מסוים לאורך שנים, ירידות ועליות בכל המוצרים בשנים מסוימות, עליית מחזור המכירות של מספר מוצרים בשנים מסוימות כשמחזורי מכירות של מוצרים אחרים אינם עולים (אם מוצאים מכנה משותף בין אותם מוצרים ניתן להסיק מסקנות אופרטיביות).
נתוני הקלט נמצאים בדרך כלל בבסיס נתונים רב-מימדי הנגזר מתוך מחסן הנתונים.
בבסיסי נתונים רב-ממדיים בניגוד ליחסיים, אין מדברים על טבלאות, עמודות ושורות אלא הנתונים מאוחסנים בקוביות בעלות ממדים (Dimensions) שונים. קוביות משלבות את כל הממדים והמדדים לתוך מודל תפיסתי אחד. קוביות מתפקדות כאמצעי אחסון לוגי למסד נתונים רב ממדי והן למעשה מה, שהמשתמשים מתפעלים בעזרת כלי הצפייה והדיווח, כדי לקבל גישה למידע. בסיס נתונים רב ממדי יכול להכיל מספר קוביות, שחלק מהממדים שלהן משותפים, והוא מאפשר לסובב את הקובייה ולהציג כל חתך דו-ממדי במרחב הרב-ממדי.
בין שני תחומים אלה קיימת חפיפה חלקית.
מערכות מסוג Decision Support System (DSS) הן מערכות ממוחשבות שתפקידן הוא סיוע בקבלת החלטות עסקיות והחלטות ארגוניות. העבודה מולן עשויה להתבצע באמצעות דיאלוג מקוון מול מקבל ההחלטה. בתהליך התמיכה בהחלטה מתבססות מערכות DSS על נתונים גולמיים, מסמכים ובסיסי ידע. חלק מהמערכות מסוג זה הן מערכות המסוגלות ללמוד מניסיונן ולשפר את קבלת ההחלטות המומלצות על ידן.
מערכות מסוג Executive Information Systems (EIS) הן מערכות תומכות החלטה המיועדות לדרג הניהול הבכיר.
הדרישות העיקריות ממערכות EIS הן:
· הצגת המידע בתמציתיות
· יכולת Drill Down
· הנדסת אנוש טובה של ממשק המשתמש: קלות וידידותיות בהפעלה
· זמני שליפה מהירים
· יכולת להצגת חריגים (Exceptions)
מהגדרת מערכות EIS, ברור שאפשר להתייחס אליהן כאל סוג של מערכות DSS, המיועדות למנהלים.
הקלט למערכות EIS הוא בסיס מידע מצומצם יחסית, הנגזר מתוך מחסן הנתונים.
בשנות ה- 90 של המאה הקודמת היו מערכות EIS פופולאריות. כתוצאה מכך הורחב השימוש בהן גם לדרגים בכירים פחות. ה- E שבראשי התיבות הפך מ- Executive ל- Everyone והן איבדו את ייחודן.
גם כיום יש צורך ושימוש במערכות EIS המיועדות למנהלים בכירים, אבל השימוש במינוח זה פחות נפוץ.
מערכות EIS ומערכות DSS, עשויות לעשות שימוש בניתוחים המבוססים על כריית מידע ועל OLAP.
תחום זה הופך ליותר ויותר מרכזי. הדגש בתחום זה הוא על דווחים, ניתוחים והחלטות בזמן אמיתי. תחום זה קשור לניהול אירועים, כלומר: Event Driven Architecture ו- Complex Event Processing. מערכת ה- Operational BI מתחילה בפעולתה בהתרחש אירוע.
הנושא הקלאסי בתחום של Operational BI הוא: Fraud Detection. כך למשל כאשר מתבצעת טרנזקציה בנקאית של משיכת כסף מחשבון, מופעלת אפליקציה כזו. היא מנתחת האם המשיכה מתאימה לדפוסי המשיכה של אותו לקוח. במידה שהיא אינה מתאימה, המערכת מוציאה התראה ללקוח, למשל: באמצעות הודעת SMS. הלקוח יכול לאשר או להכחיש במהירות האם ביצע את הפעולה. במקביל עשויה להישלח התראה גם לגורמים בתוך הבנק.
Business Performance Management (BPM) עוסק בניתוחים הקשורים במטרות העסקיות של הארגון. הניתוחים עשויים לעסוק בהיבטים הבאים:
· הגדרת מטרות הארגון
· מדידת ביצועי הארגון למימוש מטרותיו
· שיפור ביצועי הארגון – כלים למנהלים לבצע שינויים על בסיס מדידות הביצועים על מנת לשפר את הביצועים בעתיד.
BPM הוא תהליך אינטראקטיבי מתמשך בו מטופלים שלושת ההיבטים במקביל.
השימוש ב- BPM נועד למדוד את הדברים הבאים:
· קשר בין תכנון וביצוע
· קשר בין המטרות העסקיות והאסטרטגיה לבין הטקטיקה והביצוע בשטח
· קשר בין המטרות של הארגון כלו לבין המטרות של יחידות בתוך הארגון.
מתודולוגיות נפוצות המשמשות במדידת ביצועים עסקיים: Balanced Scorecard, Total Quality Management (TQM), Six Sigma ו- Activity Based Costing (ABC).
כלי BI ייעודיים לתמיכה ב- BPM וכלי BI אחרים מספקים ניתוחים ודווחים המסייעים במימוש הטיפול בביצועים העסקיים של הארגון.
ניתן להשתמש בנוהל מפת"ח עם שינויים מעטים לתמיכה במימוש BI בארגון.
מחזור החיים על פי נוהל מפת"ח מתייחס בדרך כלל למערכות שהשימוש בהן הוא לטווח ארוך. גם השימוש בחלק ממערכות ה- BI הן מערכות כאלה, שבהן המודל הכללי של מחזור חיים על פי נוהל מפת"ח תקף. לעומת זאת חלק ממערכות ה- BI הן מערכות אד-הוק לטווח קצר ויש להחיל עליהן את כללי מפת"ח לגבי מערכות קטנות או שימוש במפת"חון למשימות אד-הוק.
מערכות BI שיטתיות, שהשימוש בהן הוא שימוש חוזר על פי תקופות, כגון: מערכות דווח תקופתיות למנהלים (שנתיות, רבעוניות, חודשיות וכיו"ב) הן מערכות כאלה. המערכות יכולות להיות מערכות BI מסורתיות מבוססות Data Warehouseאו מערכות מסוג Operational BIאו מערכות מבוססות Big Data. במקרים רבים במערכות BI מבוססות ת Data Warehouseגם התהליכים הם תהליכים חוזרים.
ברוב המקרים מערכות Analytic BI, המבצעות ניתוחים מורכבים יהיו מערכות שיטתיות עם שימוש לטווח ארוך, זאת משום שההשקעה בתכנון הניתוחים עשויה להיות גדולה.
מערכות BI שהשימוש בהן הוא לטווח זמן קצר, הן ברוב המקרים מערכות לדיווחי אד-הוק. ייתכן שיעשה בהן שימוש לא שיטתי במשך מספר חודשים או מספר קטן של שנים. מערכות BI אלה הן מערכות קטנות ולכן יפותחו בדרך כלל על פי המתווה והעקרונות של פיתוח מערכת קטנה, כמפורט בקיט "מערכות קטנות". ברוב המקרים, מתוך קיט מערכות קטנות, ייבחר המתווה של מחזור חיים מקוצר ולא של מחזור חיים מתואם.
אפיון ממדי הקובייה הוא האלמנט העיקרי בשלב של אפיון המערכת. יש קשר הדוק בין מבנה הקובייה לבין העיבודים שניתן לבצע והדו"חות שניתן להפיק. עשוי להיות קושי בשינוי ממדים.
שלב העיצוב והבנייה מתמקד בעיצוב מבנה הקובייה הכללי, הממדים וההיררכיות שלה, תצוגת המדדים והגדרת חישובים נוספים. השקעה מרכזית נוספת היא בעיצוב הממשק למשתמש, בניית הדו"חות/מצגות והתאמה של כלי הצפייה למודלים הנדרשים של הצגת הנתונים וניתוחם.
בדומה למה שתואר בסעיף מחזור חיים גם בסעיף זה נבחין בין מערכות BI אד-הוק קטנות, לבין יתר מערכות ה- BI. במערכות אד-הוק קטנות, עץ המערכת ייבנה על פי המתווה המתואר בקיט "מערכות קטנות". בהמשך נתייחס רק לרוב מערכות ה- BI שאינן מערכות אד-הוק קטנות.
למערכות BI יש קשר הדוק יותר להיבטים העסקיים מאשר למערכת יישומית רגילה. הקשר ההדוק בא לידי ביטוי גם בביצוע חלק מהמטלות בתחום המחשוב על ידי משתמשים עסקיים או במשותף על ידי מומחי מחשוב ומשתמשים עסקיים.
כללית, עץ המערכת האוניברסאלי של מפת"ח מתאים למערכות BI. שינויים והדגשים יפורטו בהמשך פרק זה.
פרק היעדים אינו משתנה בנערכות BI, מבחינת מבנה הסעיפים. עשויים להיות שינויים בתכנים, בהדגשים ובתפיסה הכוללת שמאחורי התכנים.
להלן תיאור קצר של שינויים אפשריים בפרק היעדים, בהקשר של מערכות BI
הסעיף |
מהות השינוי |
1.1 לקוח / מומחה יישום |
בחלק מהמקרים הלקוח/מומחה היישום הוא דרג ניהולי. בחלק מהמקרים דרג ניהולי בכיר. |
1.4 הקשר ארגוני / עסקי |
מורחב יחסית בגלל הקשר ההדוק בין BI להיבטים עסקיים. |
1.6 ישימות ועלות/תועלת |
היות שבחלק גדול מהמקרים מערכות BI אינן מערכות תפעוליות, אלא מערכות התומכות בהחלטה ובפעולה, עלול להיות קושי בכימות תועלות עסקיות. האם כתוצאה מדווחי מערכת BI יקבל מנהל החלטות עסקיות טובות יותר, שלא היה מקבל בלעדיהן? אם כן, האם בכלל ניתן לכמת את התועלות? |
פרק היישום אינו משתנה במערכות BI מבחינת מבנה הסעיפים. עשויים להיות שינויים בתכנים, הדגשים ובתפיסה הכוללת שמאחורי התכנים. בהקשר זה יש לשים לב לנקודות הבאות:
הסעיף |
מהות השינוי |
---|---|
|
בדרך כלל מספר המשתמשים קטן יחסית למספר המשתמשים במערכות תפעוליות |
2.2.2 מערכות משיקות
|
לרוב מערכות משיקות אינן מערכות BI. המערכות המשיקות הן מערכות תפעוליות המייצרות מידע עבור מערכת ה- BI או מערכות תפעוליות היוצרות אירוע, המחייב הפעלת מערכת BI. |
2.4 ממשק משתמש |
דגש על תצוגה של נתונים משמעותיים לביצוע פעולה. במקרים רבים תצוגה גרפית . |
2.5 תהליכים |
מרבית התהליכים הם תהליכי איסוף מידע . נכון במיוחד ל- BI מול Data Warehouse מסורתי. |
2.6. טרנזקציות |
ניתן לוותר על סעיף זה בדרך כלל. מערכות BI אינן מערכות טרנזקציונליות. |
2.15 דו"חות ושאילתות |
סעיף מרכזי ומהותי, שיש לשים עליו דגש. |
2.19 אבטחת מידע |
יש לתת את הדעת על אבטחת מידע לדו"חות BI בכלל ולדו"חות BI ניהוליים בפרט. המידע בהם עשוי להיות מידע בעל חשיבות עסקית גבוהה. חשוב להגן על בסיסי נתונים המהווים קלט למערכות BI ובמיוחד לבסיסי נתונים בהם מידע מעובד או מידע שנעשתה לו אגרגציה. |
2.21. נפחים עומסים וביצועים |
מהות סעיף זה שונה ממהותו במערכות טרנזקציונאליות. דרישות הביצועים פחות מחמירות וברוב המקרים מספר המשתמשים במקביל קטן יותר. לסעיף יש משמעות בעיקר בהקשרים של שלבי יצירת ועדכון בסיס נתונים של Data Warehouse, המשמש לניתוחי BI ובהקשר של Big Data . |
2.22 ממשקים חיצוניים |
בדרך כלל יהיו יותר ממשקים נכנסים שמטרתם להעביר מידע אל מערכת ה- BI, מאשר ממשקים יוצאים למערכות אחרות. |
פרק הטכנולוגיה אינו עובר שינויים עקרוניים מהותיים. חלק מהסעיפים בו פחות רלבנטיים למערכות BI.
הסעיף |
מהות השינוי |
3.15 כלי תפעול וייצור |
במקרים רבים סעיף זה אינו רלבנטי וניתן לדלג עליו. |
3.21 תוכנות מדף – תשתית מחשב הלקוח |
במקרים רבים סעיף פחות רלבנטי |
3.21 תוכנות מדף – יישומיות מחשב הלקוח |
במקרים רבים סעיף פחות רלבנטי |
3.30, 3.31,3.32 תקשורת: רחבה, מקומית וציבורית |
סעיף פחות מהותי בהשוואה למערכות תפעוליות. במקרים רבים ניתן לקצר. |
במערכות BI צפויים שינויים רבים ותכופים יותר מאשר במערכות אחרות: דרישות לדו"חות חדשים ולשיפורים חדשים או לחילופין פיתוח דו"חות חדשים על ידי המשתמש עצמו. השינויים הם אספקט דינמי, שפחות בא לידי ביטוח בפרק המימוש, על אף במהלך המימוש עצמו חשוב יהיה לתת עליהם את הדעת, בהקשרים כמו ניהול שינויים וביטול דו"חות שהופסק השימוש בהם. צפויים ההדגשים והשינויים הבאים:
הסעיף |
מהות השינוי/ההדגש |
---|---|
4.1 גורמים מעורבים |
עשוי לכלול משתמשים עסקיים וגורמים מחוץ לארגון. |
4.4 תפעול שוטף |
סעיף פחות רלבנטי בחלק ממערכות BI |
4.7 השתלבות בארגון |
במקרים רבים המערכת עונה על צרכים ספציפיים של משתמשים,כך שהאתגר בהנעת המערכת שולי. |
4.9 תצורת |
סעיף פחות רלבנטי בחלק ממערכות BI |
פרק העלות אינו צפוי לעבור שינויים מהותיים. להלן מספר הדגשים:
הסעיף |
מהות השינוי/ההדגש |
---|---|
5.3 עלות לפי תצורות |
סעיף שבמקרים רבים אינו רלבנטי |
5.5. עלות כוללת ופריסה |
לא תמיד נושא הפריסה רלבנטי |
5.2 עלות שוטפת |
פחות ניתנים לחיזוי מדויק במערכות BI בהשוואה למערכות תפעוליות |
5.99 צפי עלויות עתידיות |
אבטחת איכות במערכות בינה עסקית מתמקדת באיכות הנתונים.
המשמעות של איכות נתונים לא טובה מספיק במערכת, המהווה בסיס לביצוע פעולות וקבלת החלטות עשויה להיות גדולה יותר מאשר במערכות אחרות. כך למשל טעות בדו"ח פילוח מכירות לפי אזורים גיאוגרפיים, עלולה לגרום להחלטות אסטרטגיות שגויות. חשוב להבין כי טעות בנתון מסוכם (אגרגצית נתונים) המהווה קלט לתהליך בינה עסקית עלולה להיות חמורה יותר מאשר בנתון פרטני במערכת אחרת. כמו כן נתון שגוי אחד עלול לעוות לגמרי ממוצע, המבוסס על מספר גדול של נתונים.
לפי העיקרון של Garbage In Garbage Out איכות נתונים ייעודיים למערכות BI, עלולה להיות מושפעת מאיכות נתוני קלט למערכת ה- BI.
ניהול האיכות במערכות BI אינו מוגבל רק לניהול איכות הנתונים. גם לוגיקת ניתוח שגויה עלולה להביא לביצוע פעולות עסקיות חשובות שגויות. לכן חשוב לנהל גם את איכות היבט זה (נתונים) וגם את איכותם של היבטים נוספים (למשל: איכות ניתוח הנתונים שבוצע). ניהול איכות לוגיקה עסקית של תוכנת הניתוח, דומה לניהול אבטחת איכות של קוד במערכות אחרות.
לגישה יוזמת ((Proactive, בה נמדדת האיכות של הנתונים גם במהלך עיבודם, עשויים להיות יתרונות לעומת גישה מגיבה (Responsive), בה רק מגיבים לטעויות שנמצאו בעיבודי BI.
להלן מספר מדדי איכות למערכות BI:
· מספר המקרים ביחידת זמן בהם היו בעיות משמעותיות באיכות נתונים Data Quality Incident Management
· הנזק הכספי המשוער כתוצאה מפעולות שהסתמכו על נתונים שגויים
· מספר המקרים ביחידת זמן בהם נלקחו נתונים ממקור לא נכון
· הנזק הכספי המשוער כתוצאה מפעולות שהסתמכו על נתונים לא מדויקים ממקור לא נכון
· מספר תקלות ביחידת זמן כתוצאה מניתוח לא נכון בגלל טעות בלוגיקת קוד הניתוח או בבחירת אופן הניתוח בקוד מוכן מראש.
· הנזק הכספי המשוער כתוצאה מפעולות שהסתמכו על ניתוח או דווח שגוי.
BI הוא תחום מרכזי בהתנהלות העסקית של ארגונים: כמעט בכל תחום או נושא הכלול במפת הידע, יש תהליכים וקיים צורך לנהל אותם. כתוצאה מכך יש קשר בין BI לבין מספר רב של תחומים במפת הידע של מפת"ח. בסעיף זה יוזכרו מספר נושאים שבינם ולבין BI קיים קשר הדוק במיוחד.
מחסן נתונים קשור באופן הדוק ל- BI. במערכות BI מסורתיות מחסן הנתונים מהווה קלט למערכות BI אנליטיות בגלל שמחסן הנתונים הוא מקרים רבים הקלט לעיבודי מערכות BI, תהליכי הקמתו ועדכונו עשויים להשפיע במידה רבה על תוצאות עיבודי בינה עסקית אנליטיים.
ניתן לחלק את CRM לשלושה תחומים עיקריים: Operational, Analytic, Collaborative .
התחום של Analytic CRM קשור באופן הדוק ל- BI. הקרבה בין שני התחומים גדולה עד כדי כך, שחלק מיצרני סוויטות CRM שפיתחו רכיבים אנליטיים ניסו להרחיב אותם למוצרי BI כלליים. מרכיבי CRM כמו ניהול Campaign מחייבים ניתוח מעמיק מסוג הדומה ל- Analytic BI.
סוויטות ה- ERP מכילות בדרך כלל מרכיב דווחי ומרכיב של מחסן נתונים. הסיבה היא שכמו מערכות ליבה עסקיות, שפותחו באופן עצמאי, גם את מערכות ERP התפעוליות צריכים להשלים רכיבים אנליטיים ודיווחיים.
כמו בנושאים נלווים רבים אחרים, המרכיבים האנליטיים של יצרני ה- ERP, נפלו בדרך כלל ממוצרים ייעודיים מבחינת פונקציונאליות. יתרונם היה באינטגרציה טובה יותר עם יתר מודולי ה- ERP. בשנים האחרונות ניסו יצרני ה- ERP להתמודד עם פער זה באמצעות רכישת חברות המייצרות מוצרי BI מובילים. כך למשל SAP רכשה את Business Objects ו- Oracle את Hyperion. נושא נוסף הרלבנטי ל- BI בהקשר זה הם מוצרי Data Warehouse Appliance כמו Oracle Hexadata או IBM Netazza. מוצרים אלה משפרים משמעותית ביצועי BI בסביבת Data Warehouse באמצעות מארז ייעודי כולל של תוכנה וחומרה.
מערכות ניהול ידע ומערכות BI משרתות את אותם משתמשים. בשני המקרים משתמשים בולטים הם מנהלים ועובדי ידע. שני סוגי המערכות מספקות מידע, העשוי להיות רלבנטי לביצוע פעולות עסקיות. מערכות BI מספקות מידע ממוקד ומנותח, בעוד מערכות ניהול ידע מספקות מידע מובנה פחות.
קיימים פיתרונות תשתית עם דגש על BI בעיקר במקרים בהם מדובר בעיבוד כמויות גדולות של מידע. היבטים אלה יכולים לבוא לידי ביטוי במבנה ייחודי של בסיס נתונים יחסיים המשמשים ל- Data Warehouse , בטכנולוגיות חדשניות של In Memory Database וב Data Warehouse Appliance.
העקרונות המוצגים בקיט אבטחת מידע של מפת"ח תקפים גם למערכות BI. חשוב לשים לב לכך שבמערכות BI ההיבט המרכזי של סיכוני אבטחת מידע הוא דליפת מידע, כלומר: קריאת מידע, העתקת מידע או איסוף דו"חות שלא נגרסו. בחלק מהמקרים דו"חות BI מכילים מידע אסטרטגי רגיש, שדליפתו עלולה לגרום נזקים חמורים לארגון.
היות שמערכות BI הן מערכות התומכות בפעילות עסקית ובקבלת החלטות, למשתמש יש תפקיד מרכזי והוא חייב להיות מעורב פעיל בכל ההגדרות של הדו"חות והניתוחים של מערכות BI. בחלק מהמערכות מיושמים כלים המאפשרים למשתמש שהוא Power User, לפתח בעצמו דווחים וניתוחים.
מרבית הארגונים נמצאים בשלבים שונים של מעבר לארכיטקטורת SOA. מימוש ארכיטקטורת SOA בארגון, משפיע גם על מערכות BI כשההשלכות העיקריות הן:
· שימוש ב- Data Services לאיסוף מידע עבור מערכות BI.
· אבסטרקציה של הנתונים בארגון באמצעות שימוש ב- Metadata מאפשרת התייחסות למידע על המידע ועל ידי כך מיקוד של מערכות BI בנתונים רלבנטיים.
· במקרים רבים ארכיטקטורת SOA כוללת גם(MDM) Master Data Management. ה- MDM מגדיר היכן נמצא הנתון הבסיסי, גם אם יש העתקים או נתונים בעלי אותה משמעות בבסיסי נתונים ובקבצים אחרים בארגון. מערכות BI יכולות לגשת לנתון זה או להעתיקו לתוך מחסן נתונים. השימוש ב- MDM עשוי לשפר את איכות הנתונים בהן עושות מערכות BI שימוש.
· במקרים בהם חלק מה- Services SOA נמצאים מחוץ לגבולות הארגון, למשל ב- Public Cloud, מערכות BI צריכות להתייחס גם לנתונים מאותם Services הנמצאים שם.
ניהול מערכות מידע קשור באופן הדוק בקבלת החלטות המבוססות על מידע. המידע צריך להיות מדווח ולפעמים גם מנותח. המידע צריך להתייחס למערכות, תהליכים ואנשים ביחידת המחשוב. מערכות BI מספקות מידע נדרש זה למנהלי יחידת מחשוב, לצורך קבלת החלטות ופעולות לביצוע על מנת לממש אותן.
תבנית זו מיועדת לסייע בהכנת מסמכי מחזור חיים במערכות BI (Business Intelligence). התבנית מכילה עץ מערכת ייחודי אשר בנוי על-גבי עץ המערכת האוניברסאלי ומכיל רק את ההיבטים הייחודיים למערכות BI. התבנית משרתת את כל שלבי מחזור החיים של המערכת בשיטת תיק מערכת מתגלגל (תמ"מ). להבנת התבנית ושימוש נכון בה יש לעיין תחילה במדריך של קיט זה. כמו כן יש לעיין בתבנית עץ מערכת רמה שלישית בקיט עץ מערכת אוניברסאלי שבכרך יסודות, שהיא הבסיס לתבנית זו.
מטרתה של רשימה זו היא לסייע בידי הנהלת הארגון או הפרויקט לבחור מוצר תשתית לניהול נושא ה- BI בארגון.
היא כוללת מגוון נושאים לבחינה, פירוט הגורמים המשתתפים בבחינה ומשמעות הקריטריון.
רשימת זו היא רשימה למימוש (Implementation) של BI בארגון. היא שונה מפרק המימוש בתיק מערכת BI בכך שהיא מתייחסת לכלל המימוש של BI בארגון כלו ולא במערכת BI בודדת לפיכך היא גם נוגעת בשאלות אסטרטגיות ובשאלות ארגוניות, כגון: Business Intelligence Competence Center (BICC).