כיצד להגדיר מערכת נהיגה אוטונומית מקצה לקצה?
ההגדרה הנפוצה ביותר היא שמערכת "מקצה לקצה" היא מערכת שמכניסה מידע חיישן גולמי ומוציאה ישירות משתנים המדאיגים את המשימה. לדוגמה, בזיהוי תמונות, ניתן לכנות את CNN "מקצה לקצה" בהשוואה לשיטת הפיצ'ר + המסווגן המסורתית.
במשימות נהיגה אוטונומית, נתונים מחיישנים שונים (כגון מצלמות, LiDAR, Radar או IMU...) מוקלטים, ואותות בקרת הרכב (כגון מצערת או זווית ההגה) מופקים ישירות. כדי לשקול את בעיות ההסתגלות של דגמי רכב שונים, ניתן להרגיע את התפוקה גם למסלול הנהיגה של הרכב.
בהתבסס על בסיס זה, הופיעו גם מושגים מודולריים מקצה לקצה, כמו UniAD, המשפרים את הביצועים על ידי הכנסת פיקוח על משימות ביניים רלוונטיות, בנוסף לאותות הבקרה או נקודות הציון הסופיות של הפלט. עם זאת, מהגדרה כל כך צרה, המהות של מקצה לקצה צריכה להיות העברת מידע חושי ללא אובדן.
תחילה נסקור את הממשקים בין מודולי חישה ל-PnC במערכות שאינן מקצה לקצה. בדרך כלל, אנו מזהים אובייקטים ברשימה הלבנה (כגון מכוניות, אנשים וכו') ומנתחים ומנבאים את תכונותיהם. אנו לומדים גם על הסביבה הסטטית (כגון מבנה כביש, הגבלת מהירות, רמזורים וכו'). אם היינו מפורטים יותר, היינו מזהים גם מכשולים אוניברסליים. בקיצור, פלט המידע על ידי תפיסות אלו מהווה מודל תצוגה של סצנות נהיגה מורכבות.
עם זאת, עבור כמה סצנות ברורות מאוד, ההפשטה המפורשת הנוכחית אינה יכולה לתאר במלואה את הגורמים המשפיעים על התנהגות הנהיגה בסצנה, או שהמשימות שעלינו להגדיר הן טריוויאליות מדי, וקשה למנות את כל המשימות הנדרשות. לכן, מערכות מקצה לקצה מספקות ייצוג מקיף (אולי במרומז) בתקווה לפעול באופן אוטומטי וללא אובדן על PnCs עם מידע זה. לדעתי, כל המערכות שיכולות לעמוד בדרישה זו יכולות להיקרא מקצה לקצה כללי.
באשר לנושאים אחרים, כמו כמה אופטימיזציות של תרחישי אינטראקציה דינמיים, אני מאמין שלפחות לא רק מקצה לקצה יכול לפתור את הבעיות הללו, ויתכן שקצה לקצה אינו הפתרון הטוב ביותר. שיטות מסורתיות יכולות לפתור את הבעיות הללו, וכמובן שכאשר כמות הנתונים גדולה מספיק, מקצה לקצה עשוי לספק פתרון טוב יותר.
כמה אי הבנות לגבי נהיגה אוטונומית מקצה לקצה
1. אותות בקרה ונקודות ציון חייבים להיות פלט כדי להיות מקצה לקצה.
אם אתה מסכים עם המושג הרחב מקצה לקצה שנדון לעיל, קל להבין את הבעיה הזו. מקצה לקצה צריך להדגיש את שידור המידע ללא אובדן במקום הפלט ישיר של נפח המשימה. גישה צרה מקצה לקצה תגרום להרבה צרות מיותרות ותדרוש הרבה פתרונות סמויים כדי להבטיח את הבטיחות.
2. המערכת מקצה לקצה חייבת להתבסס על דגמים גדולים או ראייה טהורה.
אין קשר הכרחי בין נהיגה אוטונומית מקצה לקצה, נהיגה אוטונומית בדגמים גדולים, ונהיגה אוטונומית ויזואלית גרידא מכיוון שהם מושגים עצמאיים לחלוטין; מערכת מקצה לקצה אינה מונעת בהכרח על ידי דגמים גדולים, והיא גם לא בהכרח מונעת על ידי ראייה טהורה. שֶׁל.
3. בטווח הארוך, האם ניתן למערכת מקצה לקצה הנ"ל במובן הצר להגיע לנהיגה אוטונומית מעל רמת L3?
הביצועים של מה שנקרא כיום FSD טהור מקצה לקצה רחוקים מלהיות מספיקים כדי לעמוד באמינות וביציבות הנדרשות ברמת L3. אם לומר זאת בצורה בוטה יותר, אם מערכת הנהיגה העצמית רוצה להתקבל על ידי הציבור, המפתח הוא האם הציבור יכול לקבל שבמקרים מסוימים, המכונה תעשה טעויות, ובני אדם יכולים לפתור אותן בקלות. זה קשה יותר עבור מערכת טהורה מקצה לקצה.
לדוגמה, גם Waymo וגם קרוז בצפון אמריקה עברו תאונות רבות. עם זאת, התאונה האחרונה של קרוז גרמה לשתי פציעות, אם כי תאונות כאלה הן די בלתי נמנעות ומקובלות על נהגים אנושיים. עם זאת, לאחר תאונה זו, המערכת העריכה לא נכון את מיקום התאונה ואת מיקום הפצועים והורדה למצב משיכה, מה שגרם לגרירת הפצועים לאורך זמן. התנהגות זו אינה מקובלת על כל נהג אנושי רגיל. זה לא ייעשה, והתוצאות יהיו רעות מאוד.
יתר על כן, זוהי קריאת השכמה שעלינו לשקול היטב כיצד להימנע ממצב זה במהלך הפיתוח והתפעול של מערכות נהיגה אוטונומית.
4. אז ברגע זה, מהם הפתרונות המעשיים לדור הבא של מערכות נהיגה מסייעת בייצור המוני?
לפי ההבנה הנוכחית שלי, כאשר משתמשים במה שנקרא מודל מקצה לקצה בנהיגה, לאחר פלט המסלול, הוא יחזיר פתרון המבוסס על שיטות מסורתיות. לחלופין, מתכננים מבוססי למידה ואלגוריתמים מסורתיים של תכנון מסלולים מפיקים מספר מסלולים בו-זמנית ולאחר מכן בוחרים מסלול אחד באמצעות בורר.
סוג זה של פתרון ובחירה סמויים מגבילים את הגבול העליון של הביצועים של מערכת מפל זו אם ארכיטקטורת מערכת זו מאומצת. אם שיטה זו עדיין מבוססת על למידת משוב טהורה, יתרחשו כשלים בלתי צפויים והמטרה להיות בטוחה לא תושג כלל.
אם נשקול אופטימיזציה מחדש או בחירה באמצעות שיטות תכנון מסורתיות במסלול הפלט הזה, זה שווה ערך למסלול המיוצר על ידי השיטה מונעת הלמידה; לכן, למה שלא נעשה אופטימיזציה ונחפש ישירות במסלול הזה?
כמובן, יש אנשים שיגידו שבעיית אופטימיזציה או חיפוש כזו אינה קמורה, יש לה מרחב מצב גדול ואי אפשר להפעיל אותה בזמן אמת על מערכת בתוך הרכב. אני מפציר בכולם לשקול היטב את השאלה הזו: בעשר השנים האחרונות, מערכת התפיסה קיבלה לפחות פי מאה את הדיבידנד של כוח המחשוב, אבל מה עם מודול ה-PnC שלנו?
אם נאפשר גם למודול PnC להשתמש בכוח מחשוב גדול, בשילוב עם כמה התקדמות באלגוריתמי אופטימיזציה מתקדמים בשנים האחרונות, האם מסקנה זו עדיין נכונה? עבור בעיה מסוג זה, עלינו לשקול מה נכון מהעקרונות הראשונים.
5. כיצד ליישב את הקשר בין שיטות מונעות נתונים ושיטות מסורתיות?
משחק שחמט הוא דוגמה דומה מאוד לנהיגה אוטונומית. בפברואר השנה, Deepmind פרסמה מאמר בשם "שחמט ברמת רב-אמן ללא חיפוש", שדן בשאלה האם ניתן להשתמש רק במונחי נתונים ולנטוש את החיפוש של MCTS ב-AlphaGo ו-AlphaZero. בדומה לנהיגה אוטונומית, רק רשת אחת משמשת לפלט ישיר של פעולות, בעוד שכל השלבים הבאים מתעלמים.
מסקנת המאמר היא שלמרות כמויות ניכרות של נתונים ופרמטרים של מודל, ניתן להשיג תוצאות סבירות למדי ללא שימוש בחיפוש. עם זאת, ישנם הבדלים משמעותיים בהשוואה לשיטות המשתמשות בחיפוש. זה שימושי במיוחד להתמודדות עם כמה משחקי קצה מורכבים.
עבור תרחישים מורכבים או מקרים פינתיים הדורשים משחקים מרובי-שלבים, האנלוגיה הזו עדיין מקשה על נטישה מוחלטת של אלגוריתמי אופטימיזציה או חיפוש מסורתיים. ניצול סביר של היתרונות של טכנולוגיות שונות כמו AlphaZero היא הדרך הטובה ביותר לשפר את הביצועים.
6.שיטה מסורתית = מבוססת כללים אם אחרת?
נאלצתי לתקן את המושג הזה שוב ושוב תוך כדי שיחה עם אנשים רבים. אנשים רבים מאמינים שכל עוד הוא אינו מבוסס נתונים בלבד, הוא אינו מבוסס כללים. לדוגמה, בשחמט, שינון נוסחאות ורשומות שחמט לפי חוק מבוסס על כללים, אבל כמו AlphaGo ו-AlphaZero, זה נותן למודל את היכולת להיות רציונלי באמצעות אופטימיזציה וחיפוש. אני לא חושב שאפשר לקרוא לזה מבוסס כללים.
בגלל זה, המודל הגדול עצמו חסר כרגע, וחוקרים מנסים לספק מודל מונחה למידה באמצעות שיטות כמו CoT. עם זאת, בניגוד למשימות הדורשות זיהוי תמונה נטו מונע נתונים וסיבות בלתי מוסברות, לכל פעולה של אדם שנוהג יש כוח מניע ברור.
תחת תכנון ארכיטקטורת האלגוריתם המתאים, מסלול ההחלטה צריך להפוך למשתנה ולהיות מותאם באופן אחיד בהנחיית יעדים מדעיים, במקום תיקון והתאמה של פרמטרים בכפייה כדי לתקן מקרים שונים. למערכת כזו כמובן אין כל מיני חוקים מוזרים מקודדים.
מַסְקָנָה
בקיצור, מקצה לקצה עשוי להיות מסלול טכני מבטיח, אבל אופן יישום הרעיון דורש מחקר נוסף. אני חושב שחבורה של נתונים ופרמטרים של מודלים זה לא הפתרון הנכון היחיד, ואם אנחנו רוצים להתעלות על אחרים, אנחנו צריכים להמשיך לעבוד קשה.
זמן פרסום: 24 באפריל 2024