ווי צו דעפינירן אַ סוף-צו-סוף אָטאַנאַמאַס דרייווינג סיסטעם?
די מערסט פּראָסט דעפֿיניציע איז אַז אַ "סוף-צו-סוף" סיסטעם איז אַ סיסטעם וואָס ינפּוץ רוי סענסער אינפֿאָרמאַציע און גלייַך אַוטפּוץ וועריאַבאַלז פון דייַגע צו די אַרבעט. פֿאַר בייַשפּיל, אין בילד דערקענונג, CNN קענען זיין גערופֿן "סוף-צו-סוף" קאַמפּערד מיט די טראדיציאנעלן שטריך + קלאַססיפיער אופֿן.
אין אָטאַנאַמאַס דרייווינג טאַסקס, דאַטן פון פאַרשידן סענסאָרס (אַזאַ ווי קאַמעראַס, LiDAR, Radar אָדער IMU ...) זענען אַרייַנשרייַב, און פאָרמיטל קאָנטראָל סיגנאַלז (אַזאַ ווי גערגל אָדער סטירינג ראָד ווינקל) זענען גלייַך רעזולטאַט. צו באַטראַכטן די אַדאַפּטיישאַן ישוז פון פאַרשידענע פאָרמיטל מאָדעלס, דער רעזולטאַט קענען אויך זיין רילאַקסט צו די דרייווינג טרייַעקטאָריע פון די פאָרמיטל.
באַזירט אויף דעם יסוד, מאַדזשאַלער סוף-צו-סוף קאַנסעפּס האָבן אויך ימערדזשד, אַזאַ ווי UniAD, וואָס פֿאַרבעסערן פאָרשטעלונג דורך ינטראָודוסינג השגחה פון באַטייַטיק ינטערמידייט טאַסקס, אין אַדישאַן צו די לעצט רעזולטאַט קאָנטראָל סיגנאַלז אָדער ווייַפּאָינץ. אָבער, פֿון אַזאַ אַ שמאָל דעפֿיניציע, די עסאַנס פון סוף-צו-סוף זאָל זיין די לאָססלעסס טראַנסמיסיע פון סענסערי אינפֿאָרמאַציע.
זאל אונדז ערשטער אָפּשאַצן די ינטערפייסיז צווישן סענסינג און PnC מאַדזשולז אין ניט-סוף-צו-סוף סיסטעמען. וסואַללי, מיר דעטעקט ווייטליסטעד אַבדזשעקץ (אַזאַ ווי קאַרס, מענטשן, אאז"ו ו) און אַנאַלייז און פאָרויסזאָגן זייער פּראָפּערטיעס. מיר אויך לערנען וועגן די סטאַטיק סוויווע (אַזאַ ווי וועג סטרוקטור, גיכקייַט לימאַץ, פאַרקער לייץ, אאז"ו ו). אויב מיר זענען מער דיטיילד, מיר וואָלט אויך דעטעקט וניווערסאַל מניעות. אין קורץ, די אינפֿאָרמאַציע רעזולטאַט דורך די פּערסעפּשאַנז קאַנסטאַטוץ אַ אַרויסווייַזן מאָדעל פון קאָמפּלעקס דרייווינג סינז.
אָבער, פֿאַר עטלעכע זייער קלאָר ווי דער טאָג סינז, די קראַנט יקספּליסאַט אַבסטראַקציע קען נישט גאָר באַשרייַבן די סיבות וואָס ווירקן דרייווינג נאַטור אין די סצענע, אָדער די טאַסקס מיר דאַרפֿן צו דעפינירן זענען צו נישטיק, און עס איז שווער צו ינומערייט אַלע די פארלאנגט טאַסקס. דעריבער, סוף-צו-סוף סיסטעמען צושטעלן אַ (טאָמער ימפּליסאַטלי) פולשטענדיק פאַרטרעטונג מיט די האָפענונג פון אויטאָמאַטיש און לאָססלעססלי אַקטינג אויף PnCs מיט די אינפֿאָרמאַציע. אין מיין מיינונג, אַלע סיסטעמען וואָס קענען טרעפן דעם פאָדערונג קענען זיין גערופֿן גענעראַליזעד סוף-צו-סוף.
ווי פֿאַר אנדערע ישוז, אַזאַ ווי עטלעכע אָפּטימיזאַטיאָנס פון דינאַמיש ינטעראַקשאַן סינעריאָוז, איך גלויבן אַז אין מינדסטער ניט בלויז סוף-צו-סוף קענען סאָלווע די פּראָבלעמס, און סוף-צו-סוף קען נישט זיין דער בעסטער לייזונג. טראַדיציאָנעל מעטהאָדס קענען סאָלווע די פראבלעמען, און פון קורס, ווען די סומע פון דאַטן איז גרויס גענוג, סוף-צו-סוף קען צושטעלן אַ בעסער לייזונג.
עטלעכע מיסאַנדערסטאַנדינגז וועגן סוף-צו-סוף אָטאַנאַמאַס דרייווינג
1. קאָנטראָל סיגנאַלז און ווייַפּאָינץ מוזן זיין רעזולטאַט צו זיין סוף-צו-סוף.
אויב איר שטימען מיט די ברייט סוף-צו-סוף באַגריף דיסקאַסט אויבן, דעם פּראָבלעם איז גרינג צו פֿאַרשטיין. סוף-צו-סוף זאָל ונטערשטרייַכן די לאָססלעסס טראַנסמיסיע פון אינפֿאָרמאַציע אלא ווי גלייַך אַוטפּוץ די אַרבעט באַנד. א שמאָל סוף-צו-סוף צוגאַנג וועט פאַרשאַפן אַ פּלאַץ פון ומנייטיק קאָנפליקט און דאַרפן אַ פּלאַץ פון געהיים סאַלושאַנז צו ענשור זיכערקייַט.
2. די סוף-צו-סוף סיסטעם מוזן זיין באזירט אויף גרויס מאָדעלס אָדער ריין זעאונג.
עס איז קיין נויטיק פֿאַרבינדונג צווישן סוף-צו-סוף אָטאַנאַמאַס דרייווינג, גרויס-מאָדעל אָטאַנאַמאַס דרייווינג, און ריין וויזשאַוואַל אָטאַנאַמאַס דרייווינג ווייַל זיי זענען גאָר פרייַ קאַנסעפּס; אַ סוף-צו-סוף סיסטעם איז ניט דאַווקע געטריבן דורך גרויס מאָדעלס, און עס איז ניט דאַווקע געטריבן דורך ריין זעאונג. פון.
3. אין די לאַנג לויפן, איז עס מעגלעך פֿאַר די אויבן-דערמאנט סוף-צו-סוף סיסטעם אין אַ שמאָל זינען צו דערגרייכן אָטאַנאַמאַס דרייווינג העכער די ל 3 מדרגה?
די פאָרשטעלונג פון וואָס איז דערווייַל גערופן ריין סוף-צו-סוף FSD איז ווייַט פון גענוג צו טרעפן די רילייאַבילאַטי און פעסטקייַט פארלאנגט אויף די L3 מדרגה. ליידער, אויב די זעלבסט-דרייווינג סיסטעם וויל זיין אנגענומען דורך דעם ציבור, דער שליסל איז צי דער ציבור קענען אָננעמען אַז אין עטלעכע קאַסעס, די מאַשין וועט מאַכן מיסטייקס, און מענטשן קענען לייכט סאָלווע זיי. דאָס איז מער שווער פֿאַר אַ ריין סוף-צו-סוף סיסטעם.
פֿאַר בייַשפּיל, Waymo און קרוז אין צפון אַמעריקע האָבן געהאט פילע אַקסאַדאַנץ. די לעצטע עקסידענט פון קרוז האָט אָבער געפֿירט צו צוויי ינדזשעריז, כאָטש אַזאַ אַקסאַדאַנץ זענען גאַנץ באַשערט און פּאַסיק פֿאַר מענטש דריווערס. אבער נאך דעם עקסידענט האט די סיסטעם נישט באשולדיגט דעם פלאץ פונעם עקסידענט און דעם פלאץ פון די פארוואונדעטע און אראפגעקלאפט אין שלעפ-איבער מאָדע, און גורם אז די פארוואונדעטע ווערן געשלעפט פאר א לאנגע צייט. דעם נאַטור איז אַנאַקסעפּטאַבאַל צו קיין נאָרמאַל מענטש שאָפער. עס וועט ניט זיין געטאן, און די רעזולטאַטן וועלן זיין זייער שלעכט.
דערצו, דאָס איז אַ וועקן-אַרויף רופן אַז מיר זאָל קערפאַלי באַטראַכטן ווי צו ויסמיידן דעם סיטואַציע בעשאַס דער אַנטוויקלונג און אָפּעראַציע פון אָטאַנאַמאַס דרייווינג סיסטעמען.
4. אַזוי אין דעם מאָמענט, וואָס זענען די פּראַקטיש סאַלושאַנז פֿאַר דער ווייַטער דור פון מאַסע-געשאפן אַססיסטעד דרייווינג סיסטעמען?
לויט מיין קראַנט פארשטאנד, ווען ניצן די אַזוי גערופענע סוף-צו-סוף מאָדעל אין דרייווינג, נאָך אַוטפּוץ די טרייַעקטאָריע, עס וועט צוריקקומען אַ לייזונג באזירט אויף טראדיציאנעלן מעטהאָדס. אַלטערנאַטיוועלי, לערנען-באזירט פּלאַנערז און טראדיציאנעלן טרייַעקטאָריע פּלאַנירונג אַלגערידאַמז רעזולטאַט קייפל טרייַעקטאָריעס סיימאַלטייניאַסלי און דעמאָלט אויסקלייַבן איין טרייַעקטאָריע דורך אַ סעלעקטאָר.
דעם מין פון געהיים לייזונג און ברירה לימאַץ די אויבערשטער שיעור פון די פאָרשטעלונג פון דעם קאַסקייד סיסטעם אויב די סיסטעם אַרקאַטעקטשער איז אנגענומען. אויב דער אופֿן איז נאָך באזירט אויף ריין באַמערקונגען לערנען, אַנפּרידיקטאַבאַל פייליערז וועט פּאַסירן און דער ציל צו זיין זיכער וועט נישט זיין אַטשיווד בייַ אַלע.
אויב מיר באַטראַכטן שייַעך-אָפּטימיזינג אָדער סאַלעקטינג ניצן טראדיציאנעלן פּלאַנירונג מעטהאָדס אויף דעם רעזולטאַט טרייַעקטאָריע, דאָס איז עקוויוואַלענט צו דער טרייַעקטאָריע געשאפן דורך די לערנען-געטריבן אופֿן; דעריבער, פארוואס טאָן מיר ניט גלייך אַפּטאַמייז און זוכן דעם טרייַעקטאָריע?
פון קורס, עטלעכע מענטשן וואָלט זאָגן אַז אַזאַ אַ אַפּטאַמאַזיישאַן אָדער זוכן פּראָבלעם איז ניט-קאַנוועקס, האט אַ גרויס שטאַט פּלאַץ און איז אוממעגלעך צו לויפן אין פאַקטיש-צייט אויף אַן אין-פאָרמיטל סיסטעם. איך בעט אַלעמען צו קערפאַלי באַטראַכטן די קשיא: אין די לעצטע צען יאָר, די מערקונג סיסטעם האט באקומען בייַ מינדסטער אַ הונדערט מאל די קאַמפּיוטינג מאַכט דיווידענד, אָבער וואָס וועגן אונדזער PnC מאָדולע?
אויב מיר אויך לאָזן די PnC מאָדולע צו נוצן גרויס קאַמפּיוטינג מאַכט, קאַמביינד מיט עטלעכע אַדוואַנסיז אין אַוואַנסירטע אַפּטאַמאַזיישאַן אַלגערידאַמז אין די לעצטע יאָרן, איז די מסקנא נאָך ריכטיק? פֿאַר דעם מין פון פּראָבלעם, מיר זאָל באַטראַכטן וואָס איז ריכטיק פון ערשטער פּרינסאַפּאַלז.
5.ווי צו שאָלעמ מאַכן די שייכות צווישן דאַטן-געטריבן און טראדיציאנעלן מעטהאָדס?
שפּילן שאָך איז אַ ביישפּיל זייער ענלעך צו אָטאַנאַמאַס דרייווינג. אין פעברואר פון דעם יאָר, Deepmind פארעפנטלעכט אַן אַרטיקל גערופֿן "גראַנדמאַסטער-מדרגה שאָך אָן זוך", דיסקאַסט צי עס איז פיזאַבאַל צו נוצן בלויז דאַטן-געטריבן און פאַרלאָזן MCTS זוכן אין AlphaGo און AlphaZero. ענלעך צו אָטאַנאַמאַס דרייווינג, בלויז איין נעץ איז געניצט צו גלייך רעזולטאַט אַקשאַנז, בשעת אַלע סאַבסאַקוואַנט סטעפּס זענען איגנאָרירט.
דער אַרטיקל קאַנקלוזט אַז, טראָץ היפּש אַמאַונץ פון דאַטן און מאָדעל פּאַראַמעטערס, גאַנץ גלייַך רעזולטאַטן קענען זיין באקומען אָן ניצן אַ זוכן. אָבער, עס זענען באַטייטיק דיפעראַנסיז קאַמפּערד מיט מעטהאָדס ניצן זוכן. דאָס איז ספּעציעל נוציק פֿאַר דילינג מיט עטלעכע קאָמפּלעקס ענדגאַמעס.
פֿאַר קאָמפּלעקס סינעריאָוז אָדער ווינקל קאַסעס וואָס דאַרפן מאַלטי-שריט שפּילערייַ, דעם אַנאַלאַדזשי נאָך מאכט עס שווער צו גאָר פאַרלאָזן טראדיציאנעלן אַפּטאַמאַזיישאַן אָדער זוכן אַלגערידאַמז. ריזאַנאַבלי ניצן די אַדוואַנטידזשיז פון פאַרשידן טעקנאַלאַדזשיז ווי AlphaZero איז דער בעסטער וועג צו פֿאַרבעסערן פאָרשטעלונג.
6. טראַדיציאָנעל אופֿן = הערשן-באזירט אויב אַנדערש?
איך האב געמוזט פארריכטן דעם באגריף נאכאמאל און נאכאמאל ווען איך האב גערעדט מיט פילע מענטשן. פילע מענטשן גלויבן אַז ווי לאַנג ווי עס איז נישט ריין דאַטן-געטריבן, עס איז נישט הערשן-באזירט. צום ביישפּיל, אין שאָך, מעמערייזינג פאָרמולאַס און שאָך רעקאָרדס דורך ראָט איז הערשן-באזירט, אָבער ווי AlphaGo און AlphaZero, עס גיט די מאָדעל די פיייקייט צו זיין ראַשאַנאַל דורך אַפּטאַמאַזיישאַן און זוכן. איך מיין אז מען קען עס נישט רופן לויט כללים.
צוליב דעם, דער גרויסער מאָדעל זיך איז דערווייַל פעלנדיק, און ריסערטשערז זענען טריינג צו צושטעלן אַ לערנען-געטריבן מאָדעל דורך מעטהאָדס אַזאַ ווי CoT. אָבער, ניט ענלעך טאַסקס וואָס דאַרפן ריין דאַטן-געטריבן בילד דערקענונג און אַניקספּליינד סיבות, יעדער קאַמף פון אַ מענטש דרייווינג האט אַ קלאָר דרייווינג קראַפט.
אונטער די צונעמען אַלגערידאַם אַרקאַטעקטשער פּלאַן, דער באַשלוס טרייַעקטאָריע זאָל ווערן וועריאַבאַל און יונאַפאָרמלי אָפּטימיזעד אונטער די גיידאַנס פון וויסנשאפטלעכע גאָולז, אלא ווי פאָרסאַבלי פּאַטטשינג און אַדזשאַסטינג פּאַראַמעטערס צו פאַרריכטן פאַרשידענע קאַסעס. אַזאַ סיסטעם האט געוויינטלעך נישט אַלע מינים פון שווער-קאָדעד מאָדנע כּללים.
מסקנא
אין קורץ, סוף-צו-סוף קען זיין אַ פּראַמאַסינג טעכניש מאַרשרוט, אָבער ווי דער באַגריף איז געווענדט ריקווייערז מער פאָרשונג. איך טראַכטן אַ בינטל פון דאַטן און מאָדעל פּאַראַמעטערס איז נישט דער בלויז ריכטיק לייזונג, און אויב מיר ווילן צו יקסיד אנדערע, מיר האָבן צו אַרבעטן שווער.
פּאָסטן צייט: אפריל 24-2024