הוויכוח שלא יסתיים בין ה- Big Data ל- Small Data

Big Data

[מקור התמונה]

Big Data מהו?

Big Data (בעברית נתוני עָתֵק) הוא מונח המתייחס למאגר מידע הכולל נתונים מבוזרים, שאינם מאורגנים לפי שיטה כלשהי, שמגיעים ממקורות רבים, בכמויות גדולות, בפורמטים מגוונים, ובאיכויות שונות. כל ארגון אוגר ומטפל, בימינו, בכמויות בלתי נתפסות של מידע: משיחות טלפון מוקלטות ועד הרגלי הקניה של לקוחותיו.

אחד האתגרים הגדולים של טיפול ב-Big Data הוא מיצוי תובנות ומסקנות מעשיות מתוך הררי המידע הזמינים. כדי לעשות כן, יש צורך במערכות המבצעות בדרכים שונות "כריית מידע" מהמאגר, בהקשרים שונים, כולל שימוש ב היא יישום בכלי בינה מלאוכתית.

האתגר בניהול נתוני עתק הפך תחום זה לעניין מרכזי בטכנולוגיית מידע: העלות הזולה יחסית של אמצעי האחסון, מצד אחד; והכמות הגדולה של מידע המגיע משלל מקורות (אתרי אינטרנט, רשתות חברתיות, מכשירים סלולריים, מצלמות אבטחה, חיישנים ועוד), מצד שני, גורם לכך שמידע נאגר ללא מחיקה, ומאפשר יכולות ניתוח וזיהוי תבניות ומִתְאָמִים, הנדרשות בעולמות תוכן רבים.

תחום זה נדחף על ידי בעלי עניין משום שהוא רווחי מאוד. הוא מחייב ארגונים להגדיל כל העת את מאגריהם ולגבות אותם, ומאפשר לחברות לפתח עוד ועוד טכניקות ל"כריית יעד" רלוונטי מתוך החומר.

במארס 2012 הכריז הממשל האמריקני על תוכנית מחקר חדשה בתקציב של 200 מיליון דולר בתחום מערכות המחשוב של Big-Data (לוהר, 2012).

לכן, תחום זה מצטייר היום כתחום מבטיח, אם כי רבים בו גם הסיכונים בנוסח 'האח הגדול' שאוגר בשרתיו מידע על אזרחים ועושה בו שימוש לצרכיו.

Small Data מהו?

'Small Data' הוא מונח המתייחס לעשיית שימוש בכמות קטנה יחסית של נתונים, בנפח ופורמט, שעושה אותו לנגיש, אינפורמטיבי ושימושי. אחד החוקים של מערכת מורכבת גורס כי למרות מורכבות המערכת, רק מספר קטן של גורמים משפיע עליה בזמן ובמקום נתונים. על בסיס העיקרון הזה, ניתן "לייצר" (בניגוד ל"ליצור" המחייב יצירתיות ותנאים מיוחדים) ידע רב בעזרת מידע מועט ובסיסי. אין כל צורך באגירת מידע ('Big Data'), ואין צורך בתוכנות יקרות ל"כרייתו". מכאן נלקח שמה של מערכת DNA-7 לאבחון רשתי. מרגע שהדנ"א בידינו, ניתן להרכיב ממנו את כל הידע הדרוש לנו. גישת ה- 'Small Data' מתאימה במיוחד גם למה שמכונה, האינטרנט של הדברים ( Internet of the Things - IOT), משמע, טכנולוגיה המאפשרת תקשורת מתקדמת בין מכשירים, מערכות ושירותים באמצעות מגוון רחב של פרוטוקולים ויישומים, המחברים התקנים ממחושבים לתשתית האינטרנט. החיבור של התקנים אלה צפוי להוביל לאוטומציה בתחומים רבים, ויאפשר שימוש בשירותים מתקדמים כמו רשת חכמה. האינטרנט של הדברים מבוסס על בסיס נתונים קטן, המכיל תכונות מאוד ספציפיות, שיאפשר לנו מידע ושליטה על מיקום, טמפרטורה, רטיבות, לחץ, רעידות, או אפילו אם פריט מסויים נפתח או לא. לצורך כך, אין צורך במערכי נתונים גדולים, המספקים, בעיקר, מבט היסטורי. small data

מה ביניהם?

במרץ 2012 יצא המגזין 'פורבס' בכתבה מרתקת נגד ה- Big Data. לטענתו, גישה זו שגויה. כך גם התכנות הרבות המפותחות על מנת 'לדוג' את המוץ מן התבן. צי שלם של מפתחים נותן תשובות לשאלות שאינן מעניינות איש בארגונים.המידע בנתוני קבוצה גדולה כפוף לחוק התפוקה השולית הפוחתת. מניסיון הכותב, התובנות הינן צנועות ומדורגות ואינן יוצרות קפיצת מדרגה. אבל, כיוון שהאינטרס העסקי של חברות ענק תלוי ב- Big Data, וכיוון שעקב כך, ועקב התמכרות חברות לאגירת נתונים, מושקעים סכומי עתק ביכולת לפתח מלאכותית שתוכל להפיק את המירב מהררי המידע האגור, סביר שעתידו של ה- Big Data עוד לפניו. זאת, למרות שהקונספט של ה- Small Data מתוחכם יותר וזול הרבה יותר. לכן, חברות שתשכלנה לבסס את תהליך "ייצור הידע" שלהן על ה- Small Data, תרווחנה בגדול!

מקורות והעשרה

 

One thought on “הוויכוח שלא יסתיים בין ה- Big Data ל- Small Data

  1. Pingback: נושא לימוד: טכנולוגיות במשאבי אנוש - ייצור ידע

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *