מטמון סמנטי עבור ניתוח תמונה מאופשר AI

Anonim

הזמינות של חיישנים ברזולוציה גבוהה, זולה הגדילה באופן אקספוננציאלי את כמות הנתונים המיוצרים, מה שעלול להציף את האינטרנט הקיים. זה הוביל את הצורך קיבולת מחשוב כדי לעבד את הנתונים קרוב למקום שבו הוא נוצר, בשולי הרשת, במקום לשלוח אותו למרכזי ענן. מחשוב קצה, כפי שזה ידוע, לא רק מפחית את המתח על רוחב הפס, אלא גם מקטין את ההשהיה של קבלת מודיעין מן הנתונים הגולמיים. עם זאת, הזמינות של משאבים בקצה היא מוגבלת בשל חוסר כלכלות בקנה מידה שהופכים את תשתית הענן חסכונית לנהל ולהציע.

הפוטנציאל של מחשוב קצה אינו ברור יותר מאשר עם ניתוחי וידאו. מצלמות וידאו בחדות גבוהה (1080p) הופכות לשגרה בדומיינים כמו מעקב, ובהתאם לשיעור המסגרות ודחיסת הנתונים, ניתן לייצר 4-12 מגה-בייט של נתונים לשנייה. חדש יותר 4k רזולוציה מצלמות לייצר נתונים גולמיים בסדר גודל של gigabits לשנייה. הדרישה לתובנות בזמן אמת לזרמי וידאו מסוג זה מניעה את השימוש בטכניקות AI כגון רשתות עצביות עמוקות למשימות, כולל סיווג, זיהוי אובייקטים והפקתם, ואיתור אנומליה.

ב- Hot Edge 2018 Conference Conference "בובות צל: ענן ברמה מדויקת של AI מסקנות במהירות ובכלכלה של קצה", הצוות שלנו ב- IBM Research - Ireland העריך באופן ניסיוני את הביצועים של עומס עבודה AI מסוג אחד, סיווג אובייקטים, באמצעות ענן זמין מסחרית - שירותי אירוח. התוצאה הטובה ביותר שאנחנו יכולים לאבטח היה פלט סיווג של 2 מסגרות לשנייה אשר הרבה מתחת קצב הייצור וידאו סטנדרטי של 24 מסגרות לשנייה. ביצוע ניסוי דומה על מכשיר קצה נציג (NVIDIA Jetson TK1) להשיג את הדרישות חביון אבל בשימוש ביותר של המשאבים הזמינים על המכשיר בתהליך זה.

אנו מפרקים את הדואליות הזו על ידי הצעת המטמון הסמנטיקאי, גישה המשלבת את זמן האחזור הנמוך של פריסות קצה עם המשאבים האינסופיים כמעט הזמינים בענן. אנו משתמשים בטכניקה ידועה של אחסון במטמון כדי להסתיר את חביון על ידי ביצוע מסקנה AI עבור קלט מסוים (למשל מסגרת וידאו) בענן ואחסון התוצאות על הקצה נגד "טביעת אצבע", או קוד חשיש, על בסיס תכונות שחולצו מהקלט.

תכנית זו מתוכננת כך שתשומות הדומות באופן סמנטאלי (למשל, השייכות לאותה כיתה) יהיו טביעות אצבעות "קרובות" זו לזו, בהתאם למדוד מרחק. איור 1 מציג את העיצוב של המטמון. המקודד יוצר את טביעת האצבע של מסגרת וידאו קלט ומחפש את המטמון עבור טביעות אצבע במרחק מסוים. אם יש התאמה, תוצאות ההסקה מסופקות מהמטמון, ובכך להימנע מהצורך לשאילתה של שירות AI הפועל בענן.

אנו מוצאים את טביעות האצבעות מקבילות לבובות צל, שתי תחזיות של דמויות על מסך שנוצר על ידי אור ברקע. כל מי שהשתמש באצבעותיו ליצירת בובות צל יעיד על כך שהיעדר הפרטים בנתונים אלה אינו מגביל את יכולתם להיות הבסיס לסיפור טוב. טביעות האצבעות הן תחזיות של קלט בפועל שניתן להשתמש בהם עבור יישומים עשירים AI גם בהיעדר פרט מקורי.

פיתחנו הוכחה מלאה ליישום המושגים של המטמון הסמנטי, בעקבות גישת התכנון "כשירות", וחשיפת השירות למכשיר קצה / שער משתמשים באמצעות ממשק REST. ההערכות שלנו על מגוון רחב של התקני קצה שונים (פטל פאי 3 / NVIDIA Jetson TK1 / TX1 / TX2 / TX2) הוכיחו כי חביון של היסק מצטמצם על ידי 3 פעמים ואת השימוש ברוחב הפס של לפחות 50 אחוזים בהשוואה לענן, רק פתרון.

הערכה מוקדמת של יישום אב טיפוס הראשון של הגישה שלנו מציגה את הפוטנציאל שלה. אנו ממשיכים לבשל את הגישה הראשונית, מתן עדיפות על ניסויים עם טכניקות קידוד אלטרנטיבי דיוק משופרת, תוך גם הרחבת ההערכה כדי datasets נוסף ומשימות AI.

אנו רואים טכנולוגיה זו יש יישומים בתחזוקה קמעונאית, תחזוקתית עבור מתקני תעשייה, מעקב וידאו, בין היתר. לדוגמה, המטמון הסמנטי יכול לשמש לאחסון טביעות אצבע של תמונות מוצר בקופות. זה יכול לשמש כדי למנוע הפסדים בחנות עקב גניבה או סריקה לא נכונה. הגישה שלנו משמשת דוגמא להחלפה חלקה בין שירותי ענן וקצה כדי לספק פתרונות AI הטובים מסוגם על הקצה.

menu
menu