Loading AI tools
מוויקיפדיה, האנציקלופדיה החופשית
היתוך מידע הוא תהליך שמטרתו קישור, מציאת קורלציה, חיבור והצלבת נתונים (Data), מידע (Information) וידע (Knowledge) לצורך שיפור הערכת נתוני המיקום וזיהוי ישויות עליהם מבצעים איסוף ולצורך יצירת תמונת מצב והערכת איומים ורמת החשיבות שלהם. בנוסף, כחלק בלתי נפרד מתהליך היתוך המידע ובמטרה לשפר את תוצריו, מתבצעת הערכה של איכות התוצרים ונוצרות דרישות ממקורות המידע. דרישות אלה הן הבסיס ליצירת תוכנית האיסוף.
היתוך מידע יכול להתבצע באופן אוטומטי מלא, בסיוע של אלגוריתמים לעיבוד עבור גורם אנוש, או באופן אנושי לחלוטין. בכל המקרים התהליך זהה, אולם חלוקת נטל העבודה בין הגורם האנושי לגורם הממוכן שונה.
בעברית משתמשים לעיתים במונח מיזוג מידע, המקביל למונח האנגלי Data Merging. ההבדל התפיסתי בין מיזוג (merge) והיתוך (fusion), הוא שבמיזוג מספר אלמנטים מאותו טיפוס מקבלים אלמנט מאותו הטיפוס עצמו (בדרך כלל אלמנט יחיד במקום מספר האלמנטים שיצרו אותו), ואילו בהיתוך מקבלים אלמנט מטיפוס אחר - למשל שתי תמונות ברזולוציה נמוכה יותכו לתמונה אחת ברזולוציה גבוהה יותר. הבחירה במונח היתוך מידע קשורה למונח האנגלי (Data Fusion).
קבלת החלטות במצבי אי-ודאות היא מצב שכיח ביותר. בין היישומים הנפוצים אפשר למצוא מצבי מלחמה, אך גם מצבים אזרחיים, כגון בקרת מרחב אווירי או קבלת החלטה להפסיק את מתן האשראי לכרטיס אשראי שחשוד כנגנב על פי חריגה בהיקף ובסוג הרכישות שמבוצעות על ידי הכרטיס.
קבלת החלטות מושכלת מתבססת בראש ובראשונה על הבנת המצב, כלומר מהי המשמעות של סט נתונים שזורמים ממקורות שונים לגבי האובייקט או האובייקטים שלגביהם נדרש לקבל החלטות. תהליך היתוך המידע נועד לסייע במצבים בהם לפחות אחד מהתנאים הבאים מתקיימים:
לדוגמה, תמונת כלי טיס בשמים נדרשת לצורך קבלת החלטות לגבי בטיחות טיסה והגנת שמי מדינה כנגד גורמים עוינים. במקרה זה ניתן להבחין במאפיינים הבאים:
במהלך המחצית השנייה של המאה ה-20 הוחל בפיתוח מערכות שנועדו להתמודד עם מצבים אלה.
בשנת 1992 יצרו מעבדות המחקר של משרד ההגנה האמריקאי מודל המתאר את תהליך היתוך המידע כקשר בין חמש רמות עיבוד פונקציונליות, המשלבות מידע המתקבל ממקורות מידע (לדוגמה: חיישנים) ומאפשרות התערבות אנושית. המודל, הידוע בראשי התיבות JDL-DFG-92 מהווה כיום תקן דה פקטו למערכות היתוך מידע ולמחקר אקדמי בנושא בעולם.
בין הרמות הפונקציונליות של היתוך המידע קיים קשר מלא. רמת שחזור הישויות (רמה 1) יוצרת את אבני הבסיס המשמשות את רמת שחזור המצב (רמה 2) וזו משמשת להערכת המצב והאיומים (רמה 3). במקביל, גם מידע מרמות גבוהות יותר משמש את הרמות הנמוכות. כך, למשל, מידע מתמונת המצב משמש את שחזור הישויות (רמה 1) באמצעות שיפור הפרדיקציה של הישויות.
לגורם האנושי חשיבות רבה בתהליך היתוך המידע והוא בעל יכולת להתערב בכל אחת מהרמות, כמו גם לקבל את המידע הלא-מעובד (גולמי) של החישנים / מקורות המידע ולהתייחס אליו.
כדי לשפר את הבנת המודל נעשה שימוש בדוגמה הבאה: יומנאי של תחנת משטרה נדרש לנווט ניידת משטרה מדרום תל אביב לאירוע בצפון תל אביב דרך התנועה הסואנת של תל אביב בשעות העומס. לרשותו עומדים מקורות המידע הבאים: שוטרי הניידת, מצלמות תנועה בנתיבי איילון, מכשירים למדידת מהירות וגלאי המספק את מספר הרישוי של כלי רכב. נבחן את התהליכים העוברים על כל סוג מידע בכל רמת עיבוד.
ברמה 0 מתבצעים עיבודים ברמת החישן, שמטרתם לשפר את דיוק החישן ולתרגם נתונים ממרחב האותות של החישן למרחב המדידה בו נעשה שימוש במערכת היתוך המידע.
בדוגמה שלעיל, מצלמות התנועה מבצעות עיבוד ברמת החישן כדי לתרגם את האותות האופטיים לתמונת וידאו. עיבוד נוסף יכול להתבצע על ידי גלאי תנועה, שיכולים למצות מתמונת הווידאו אלמנטים שנעים, כלי רכב ולשייך מדידות בזמנים שונים זו לזו. נניח, לצורך הדוגמה, שגלאים כאלה יכולים לדווח מספר רכבים ועבור כל רכב לספק מידע לגבי מיקומו, גודלו והצבע שלו.
ברמה זו מידע המגיע ממקורות מידע שונים משויך, מעדכן ומשפר את השערוך של כל ישות עניין. התהליך מתבצע הן לגבי גדלים רציפים, לדוגמה מיקום ומהירות (קינמטיקה), והן לגבי גדלים בדידים, כמו סוג, צבע או גודל.
הרמה כוללת את השלבים הבאים:
חשוב בשלב תכנון המערכת להחליט מהי ישות העניין שלגביה מבצעים עיבוד. בדוגמה לעיל, ניתן לבחור בכלי רכב בודד כישות עניין. לפיכך, ברמה זו נבצע שערוך של כלי הרכב בכבישי תל אביב.
ברמה זו נבחן הקשר בין ישויות העניין, שלגביהן בוצע השחזור ברמה 1 לצורך יצירת תמונת מצב. בדוגמה שהוצגה קודם לכן, תמונת המצב יכולה להיות מיקום ומהירות התנועה של הרכבים בנתיבי איילון. תמונה זו ניתנת לחישוב מסך כל כלי הרכב ששערכנו את תנועתם בשלב הקודם (למרות, שניתן גם להגדיר ישות נעקבת אחרת ולחשב את תמונת המצב ממנה).
העיבודים המתבצעים ברמה זו הם:
מובן, שלא כל העיבודים נדרשים בכל מערכת. למשל, בדוגמה שהוצגה קודם לכן, די לקבץ את כל הרכבים על פי אזור ולהעריך את מהירות התנועה הממוצעת בכל קטע כביש.
ברמה זו נבחנת תמונת המצב, שהושגה ברמה הקודמת, ואת אופן ההתפתחות העתידי שלה. באופן זה, ניתן להבחין בדרכי פעולה אפשריות של כל גורם בתמונת המצב ולהעריך את האופן בו אויב מאיים על ידיד.
סוגי העיבוד המתבצעים הם:
בדוגמה שלמעלה, רמה זו יכולה לבחון מהם הסיכונים שבנסיעה באזור עמוס לעומת היתרונות של נסיעה בכבישים צדדיים ופנויים, כמו גם הערכה של מה יקרה אם שאר הרכבים יבצעו בחירה דומה.
בקרת התהליך נועדה לבחון באופן מתמיד את תוצרי היתוך המידע מכל הרמות ולהציע דרכים לשיפורם באמצעות הפעלה משופרת של מקורות המידע או שיפור בתהליכי העיבוד.
לפיכך, העיבודים המתבצעים הם:
בדוגמת ניידת המשטרה הנעה בכבישי תל אביב: הפעלת מצלמות התנועה בעיר היא ניהול מקורות המידע והכוונות התנועה לניידת הן ניהול משימה.
היתוך מידע ניתן לבצע בשיטות שונות, ולכל שיטה יתרונות וחסרונות.
בשיטה זו, דיווח של מקור מידע עובר את תהליכי העיבוד שתוארו קודם לכן. בתום תהליך העיבוד, הדיווח יכול להשתייך למספר ישויות עניין עם ציון עבור כל חלופת שיוך. בהתאם לציון נבחרת רק ההשערה הטובה ביותר ושאר ההשערות אינן נשמרות.
יתרונות השיטה הם בפשטותה ובסיבוכיות הנמוכה שלה. לעומת זאת, חסרונות השיטה בשיוך של מספר רב של מקורות מידע עבור מספר רב של ישויות עניין לאורך זמן. לדוגמה, נניח ששני מטוסים טסים בקו ישר בסמיכות זה לזה. מכ"מים מדווחים על מיקום המטוסים ומערכת היתוך מידע משערכת את מצב שניהם. בשלב מסוים מטוס כלשהו מתחיל לבצע פניה. המכ"מים מדווחים על הסטייה מקו הטיסה הקודם, אולם הדיווחים יכולים להיות משויכים לכל אחד מהמטוסים. שיוך מוטעה יכול להוביל לכך שהמערכת תטעה במטוס הפונה או שני המטוסים הפונים.
כדי לענות על חסרונות השיטה הקודמת פותחו שיטות של בחינת מספר השערות (Multiple Hypothesis Testing). בשיטות אלה, כל דיווח שיכול להיות משויך ליותר מישות עניין אחת מעדכן עותק אחר של תמונת המצב. העותקים מנוהלים וכל עדכון עוקב ממשיך לעדכן את כל העותקים של התמונה עד שציון אחד העותקים נהיה עדיף במידה משמעותית מעל שאר העותקים של התמונה.
בדוגמת המטוסים שהוזכרה קודם לכן, ינוהלו 4 אפשרויות של תמונות:
בהמשך, כל מידע נוסף ייבחן למול כל אחד מהעותקים האלה. למשל, רציפות של דיווחי מכ"ם על מטוס שממשיך בטיסה ישרה ומטוס שפונה יקטינו את הציון של אפשרויות 1 ו-2 אבל לא יאפשרו הבחנה בין האפשרויות 3 ו- 4. בשלב מסוים, יישארו רק אפשרויות 3 ו- 4 ופתרון אי הוודאות יתבצע באמצעים אחרים, למשל דיווח הטייס של אחד המטוסים שהוא פונה.
החסרונות העיקריים של שיטה זו היא הסיבוכיות העצומה מבחינה חישובית ומבחינת ארגון המידע בזיכרון המחשב. עבור כל אפשרות לישות בודדת מנוהלות השערות, וסך כל האפשרויות המנוהלות הוא הקומבינטוריקה של כל האפשרויות. בחלק מהיישומים שיטה זו נחשבת ללא-מעשית במערכות זמן אמת.
בהיתוך מידע נעשה שימוש במספר רב של אלגוריתמים. להלן רשימה חלקית:
המאפיינים הרציפים הם מסוג של מיקום, מהירות ובאופן כללי וקטור מצב של ישות העניין. אלגוריתמים אלה שייכים לתחום השערוך. בתחום זה נעשה שימוש בסוגים הבאים של אלגוריתמים:
המאפיינים הבדידים יכולים להיות רבים ותלויים בסוג ישות העניין ובמידת הפירוט עבור כל ישות. אלגוריתמים אלה שייכים לתחומים של הסקת מסקנות בתנאי אי ודאות, רשתות אמונה ומתבססים על מודלים שהוצעו על ידי באייס (Bayes) או תיאורית דמפסטר-שייפר (Dempster Shafer).
בניית תמונת מצב מישויות העניין מתבססת על השוואה למבני ידע ושיטות שונות לחישוב מתאם וקשרים בין ישויות העניין לבין עצמן ובינן לבין מבני הידע. דוגמאות לאלגוריתמים אלה הם:
תחום זה מחייב ידיעה ומידול של ההקשר (Context) בו מערכת היתוך המידע נדרשת לפעול. בתחום זה יש יתרון לגורם אנושי על פני מערכת מחשב, בעיקר בשל הקושי למדל את ההקשר לסט פרמטרים מתמטיים.
בבקרת התהליך עושים שימוש באלגוריתמים מהתחומים הבאים:
בכל אחד מהתחומים האלה פותחו אלגוריתמים רבים במהלך השנים, שניתן לעשות בהם שימוש במסגרת מערכות היתוך מידע.
המונח ארכיטקטורת מערכת היתוך מידע מתייחס לקשר בין מרכזי (או צומתי) עיבוד במערכת, האחראים על היבטים של היתוך המידע ועל חלוקת התפקידים ביניהם.
ניתן לממש מערכות היתוך מידע בארכיטקטורות תוכנה שונות, ולעיתים קרובות יש בכך גם צורך בהתאם לדרישות המשתמש, מקורות המידע ותשתיות העברת הנתונים. אין "פתרון נכון" לארכיטקטורת מערכת היתוך מידע ובדרך כלל נדרש לבחון את הפתרונות המוצעים לאור הבעיות עליהן המערכת נדרשת לענות באמצעות סימולציה.
ניתן גם לשלב בין ארכיטקטורות שונות, או לאפשר למערכת שבנויה באופן מסוים לתמוך גם במצבים שונים מהמתוכנן. לדוגמה, ניתן לאפשר למערכת היתוך מידע ריכוזית במצבים של אובדן קשר בין צומתי עיבוד (computer node) להפוך למערכת מבוזרת על ידי כך שכל צומת עיבוד יהיה אחראי על היתוך הנתונים המגיעים אליו. כאשר הקשר יחזור שוב בין הצמתים יידרשו מנגנונים האחראיים על סינכרון הנתונים ועל בחירת המרכז האחראי על עיבוד המידע.
בארכיטקטורה ריכוזית קלאסית, ישנו צומת עיבוד מרכזי, שמקבל את כל המידע הגולמי (או מעובד חלקית ברמת החיישן) ואחראי על ביצוע היתוך המידע בכל הרמות. תוצרי ההיתוך נשלחים לכל צרכני ההיתוך, שחלקם יכולים להיות צומתי עיבוד אחרים.
לארכיטקטורה ריכוזית היתרונות הבאים:
חסרונות הארכיטקטורה הריכוזית הם:
כדי להתגבר על חסרונות הארכיטקטורה הריכוזית ניתן לבזר את היתוך המידע בין צומתי עיבוד שונים. הביזור יכול להתבטא בחלוקת תפקידים ורמות היתוך מידע בין צמתים שונים, חלוקת אחריות דיווח בין הצמתים או אפילו ביצוע של אותן משימות היתוך מידע בכמה צמתים שונים, כאשר לכל אחת צרכנים שלה.
לאור התפתחות יכולת תקשורת המחשבים בשנים האחרונות, התפתחה תורת לחימה מבוססת רשת (Network Centric Warfare), שבה גורמי צבא שונים מחוברים זה לזה על ידי רשתות תקשורת ברוחבי פס שונים וכל גורם מספק מידע ודורש מידע מסוגים שונים. ברשתות אלה נדרשת ארכיטקטורה המאפשרת לכל גורם לתרום את חלקו, לצרוך את הנדרש לו, להתחבר ולהתנתק באופן דינמי. נושא זה נמצא היום בחזית המחקר בתחום היתוך מידע.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.