როგორ განვსაზღვროთ ბოლომდე ავტონომიური მართვის სისტემა?
ყველაზე გავრცელებული განმარტება არის ის, რომ "ბოლოდან ბოლომდე" სისტემა არის სისტემა, რომელიც შეაქვს ნედლეულ სენსორულ ინფორმაციას და პირდაპირ გამოაქვს ამოცანისთვის შემაშფოთებელი ცვლადები. მაგალითად, სურათის ამოცნობისას CNN-ს შეიძლება ეწოდოს "ბოლო-ბოლო" ტრადიციულ მახასიათებლის + კლასიფიკატორის მეთოდთან შედარებით.
ავტონომიური მართვის ამოცანებისას, მონაცემები სხვადასხვა სენსორებიდან (როგორიცაა კამერები, LiDAR, რადარი ან IMU...) შეყვანილია, ხოლო მანქანის მართვის სიგნალები (როგორიცაა დროსელის ან საჭის კუთხე) პირდაპირ გამოდის. ავტომობილის სხვადასხვა მოდელების ადაპტაციის საკითხების განხილვის მიზნით, გამოსავალი ასევე შეიძლება მოდუნდეს მანქანის მართვის ტრაექტორიაზე.
ამ საფუძველზე დაყრდნობით, ასევე გაჩნდა მოდულური ბოლოდან ბოლომდე კონცეფციები, როგორიცაა UniAD, რომელიც აუმჯობესებს შესრულებას შესაბამისი შუალედური ამოცანების ზედამხედველობის შემოღებით, საბოლოო გამომავალი კონტროლის სიგნალებისა და პუნქტების გარდა. თუმცა, ასეთი ვიწრო დეფინიციიდან გამომდინარე, არსი ბოლოდან ბოლომდე უნდა იყოს სენსორული ინფორმაციის უდანაკარგო გადაცემა.
მოდით, პირველ რიგში გადავხედოთ ინტერფეისებს სენსორულ და PnC მოდულებს შორის არა-ბოლომდე სისტემებში. ჩვეულებრივ, ჩვენ აღმოვაჩენთ თეთრ სიაში შეყვანილ ობიექტებს (როგორიცაა მანქანები, ადამიანები და ა.შ.) და ვაანალიზებთ და ვიწინასწარმეტყველებთ მათ თვისებებს. ჩვენ ასევე ვსწავლობთ სტატიკური გარემოს შესახებ (როგორიცაა გზის სტრუქტურა, სიჩქარის შეზღუდვები, შუქნიშანი და ა.შ.). უფრო დეტალურად რომ ვიყოთ, საყოველთაო დაბრკოლებებსაც აღმოვაჩენდით. მოკლედ, ამ აღქმებით მიღებული ინფორმაცია წარმოადგენს მართვის რთული სცენების ჩვენების მოდელს.
თუმცა, ზოგიერთი ძალიან აშკარა სცენისთვის, მიმდინარე აშკარა აბსტრაქცია სრულად ვერ აღწერს ფაქტორებს, რომლებიც გავლენას ახდენენ მართვის ქცევაზე სცენაზე, ან ამოცანები, რომლებიც უნდა განვსაზღვროთ, ძალიან ტრივიალურია და ძნელია ყველა საჭირო ამოცანის ჩამოთვლა. მაშასადამე, ბოლოდან ბოლომდე სისტემები უზრუნველყოფენ (შესაძლოა იმპლიციტურად) ყოვლისმომცველ წარმოდგენას იმ იმედით, რომ ავტომატურად და უზარმაზარად იმოქმედებენ PnC-ებზე ამ ინფორმაციით. ჩემი აზრით, ყველა სისტემას, რომელსაც შეუძლია დააკმაყოფილოს ეს მოთხოვნა, შეიძლება ეწოდოს განზოგადებული ბოლოდან ბოლომდე.
რაც შეეხება სხვა საკითხებს, როგორიცაა დინამიური ურთიერთქმედების სცენარების ზოგიერთი ოპტიმიზაცია, მე მჯერა, რომ ამ პრობლემების გადაჭრა მაინც არ არის მხოლოდ ბოლომდე, და ბოლომდე შეიძლება არ იყოს საუკეთესო გამოსავალი. ტრადიციულ მეთოდებს შეუძლიათ ამ პრობლემების გადაჭრა და, რა თქმა უნდა, როდესაც მონაცემთა რაოდენობა საკმარისად დიდია, თავიდან ბოლომდე უკეთესი გამოსავალია.
ზოგიერთი გაუგებრობა ბოლომდე ავტონომიური მართვის შესახებ
1. საკონტროლო სიგნალები და გზის წერტილები უნდა იყოს გამომავალი, რომ იყოს ბოლომდე.
თუ ეთანხმებით ზემოთ განხილულ ფართო კონცეფციას, მაშინ ეს პრობლემა ადვილი გასაგებია. ბოლოდან ბოლომდე უნდა ხაზგასმით აღვნიშნოთ ინფორმაციის უდანაკარგო გადაცემა და არა უშუალოდ ამოცანის მოცულობა. ვიწრო მიდგომა თავიდან ბოლომდე გამოიწვევს უამრავ არასაჭირო უბედურებას და მოითხოვს უამრავ ფარულ გადაწყვეტას უსაფრთხოების უზრუნველსაყოფად.
2. ბოლოდან ბოლომდე სისტემა უნდა ეფუძნებოდეს დიდ მოდელებს ან სუფთა ხედვას.
არ არსებობს აუცილებელი კავშირი ბოლომდე ავტონომიურ მართვას, დიდი მოდელის ავტონომიურ მართვასა და წმინდა ვიზუალურ ავტონომიურ მართვას შორის, რადგან ისინი სრულიად დამოუკიდებელი ცნებებია; ბოლოდან ბოლომდე სისტემას სულაც არ მართავს დიდი მოდელები და არც წმინდა ხედვა. დან.
3. გრძელვადიან პერსპექტივაში, შესაძლებელია თუ არა ზემოთ ხსენებულმა სისტემამ, ვიწრო გაგებით, მიაღწიოს ავტონომიურ მართვას L3 დონეზე ზემოთ?
ეფექტურობა, რასაც ამჟამად უწოდებენ სუფთა ბოლოდან ბოლომდე FSD-ს, შორს არის საკმარისი იმისათვის, რომ დააკმაყოფილოს L3 დონეზე საჭირო საიმედოობა და სტაბილურობა. უფრო უხეშად რომ ვთქვათ, თუ თვითმმართველობის სისტემას სურს საზოგადოების მიერ მიღება, მთავარია თუ არა საზოგადოება მიიღოს, რომ ზოგიერთ შემთხვევაში მანქანა შეცდომებს დაუშვებს და ადამიანებს მარტივად შეუძლიათ მათი გადაჭრა. ეს უფრო რთულია სუფთა ბოლომდე სისტემისთვის.
მაგალითად, Waymo-ს და Cruise-საც ჩრდილოეთ ამერიკაში ბევრი ავარია ჰქონიათ. თუმცა, კრუზის ბოლო ავარია ორი დაშავდა, თუმცა ასეთი ავარიები საკმაოდ გარდაუვალი და მისაღებია ადამიანების მძღოლებისთვის. თუმცა, ამ შემთხვევის შემდეგ სისტემამ არასწორად შეაფასა შემთხვევის ადგილი და დაშავებულის მდებარეობა და დაქვეითდა გადაყვანის რეჟიმზე, რამაც გამოიწვია დაშავებულის დიდი ხნით გადათრევა. ეს ქცევა მიუღებელია ნებისმიერი ნორმალური ადამიანის მძღოლისთვის. ეს არ გაკეთდება და შედეგები ძალიან ცუდი იქნება.
გარდა ამისა, ეს არის გამოფხიზლების ზარი, რომელიც ყურადღებით უნდა განვიხილოთ, თუ როგორ ავიცილოთ თავიდან ეს სიტუაცია ავტონომიური მართვის სისტემების შემუშავებისა და მუშაობის დროს.
4. ამ მომენტში, რა არის პრაქტიკული გადაწყვეტილებები შემდეგი თაობის მასობრივი წარმოების დამხმარე მართვის სისტემებისთვის?
ჩემი ამჟამინდელი გაგებით, ეგრეთ წოდებული „end-to-end მოდელის“ გამოყენებისას, ტრაექტორიის გამოტანის შემდეგ, ის დაუბრუნდება ტრადიციულ მეთოდებზე დაფუძნებულ გადაწყვეტას. ალტერნატიულად, სწავლაზე დაფუძნებული დამგეგმავები და ტრაექტორიის დაგეგმვის ტრადიციული ალგორითმები ერთდროულად აწარმოებენ რამდენიმე ტრაექტორიას და შემდეგ ირჩევენ ერთ ტრაექტორიას სელექტორის მეშვეობით.
ამ სახის ფარული გადაწყვეტა და არჩევანი ზღუდავს ამ კასკადური სისტემის მუშაობის ზედა ზღვარს, თუ ეს სისტემის არქიტექტურა იქნება მიღებული. თუ ეს მეთოდი მაინც დაფუძნებულია სუფთა უკუკავშირის სწავლაზე, მოხდება არაპროგნოზირებადი წარუმატებლობები და უსაფრთხოდ ყოფნის მიზანი საერთოდ ვერ იქნება მიღწეული.
თუ განვიხილავთ ხელახალი ოპტიმიზაციას ან შერჩევას ტრადიციული დაგეგმვის მეთოდების გამოყენებით ამ გამომავალი ტრაექტორიაზე, ეს ექვივალენტურია სწავლაზე ორიენტირებული მეთოდით წარმოებული ტრაექტორიისა; ამიტომ, რატომ არ ვახორციელებთ ამ ტრაექტორიის უშუალო ოპტიმიზაციას და ძიებას?
რა თქმა უნდა, ზოგიერთი ადამიანი იტყვის, რომ ოპტიმიზაციის ან ძიების ასეთი პრობლემა არ არის ამოზნექილი, აქვს დიდი მდგომარეობის სივრცე და შეუძლებელია რეალურ დროში გაშვება სატრანსპორტო სისტემაში. ყველას მოვუწოდებ, ყურადღებით განიხილონ ეს კითხვა: გასული ათი წლის განმავლობაში აღქმის სისტემამ მიიღო მინიმუმ ასჯერ მეტი გამოთვლითი სიმძლავრის დივიდენდი, მაგრამ რაც შეეხება ჩვენს PnC მოდულს?
თუ ჩვენ ასევე დავუშვებთ PnC მოდულს გამოიყენოს დიდი გამოთვლითი სიმძლავრე, ბოლო წლების ოპტიმიზაციის ალგორითმების გარკვეულ მიღწევებთან ერთად, ეს დასკვნა მაინც სწორია? ამ სახის პრობლემისთვის უნდა განვიხილოთ, რა არის სწორი პირველი პრინციპებიდან.
5.როგორ შევადაროთ ურთიერთობა მონაცემებზე ორიენტირებულ და ტრადიციულ მეთოდებს შორის?
ჭადრაკის თამაში ავტონომიური მართვის მაგალითია. ამ წლის თებერვალში, Deepmind-მა გამოაქვეყნა სტატია სახელწოდებით "დიდოსტატის დონის ჭადრაკი ძიების გარეშე", სადაც განიხილებოდა, შესაძლებელია თუ არა მხოლოდ მონაცემების საფუძველზე გამოყენება და MCTS ძიების მიტოვება AlphaGo-სა და AlphaZero-ში. ავტონომიური მართვის მსგავსად, მხოლოდ ერთი ქსელი გამოიყენება უშუალოდ მოქმედებების გამოსატანად, ხოლო ყველა შემდგომი ნაბიჯი იგნორირებულია.
სტატია ასკვნის, რომ დიდი რაოდენობით მონაცემებისა და მოდელის პარამეტრების მიუხედავად, საკმაოდ გონივრული შედეგების მიღება შესაძლებელია ძიების გამოყენების გარეშე. თუმცა, არსებობს მნიშვნელოვანი განსხვავებები ძიების მეთოდებთან შედარებით. ეს განსაკუთრებით სასარგებლოა ზოგიერთ რთულ ბოლო თამაშებთან გამკლავებისთვის.
რთული სცენარებისთვის ან კუთხის შემთხვევებისთვის, რომლებიც საჭიროებენ მრავალსაფეხურიან თამაშებს, ეს ანალოგია მაინც ართულებს ტრადიციული ოპტიმიზაციის ან ძიების ალგორითმების სრულად მიტოვებას. სხვადასხვა ტექნოლოგიების უპირატესობების გონივრულად გამოყენება, როგორიცაა AlphaZero, საუკეთესო გზაა შესრულების გასაუმჯობესებლად.
6.ტრადიციული მეთოდი = წესებზე დაფუძნებული თუ სხვა?
მე მომიწია ამ კონცეფციის გამოსწორება უამრავ ადამიანთან საუბრისას. ბევრს სჯერა, რომ სანამ ის არ არის მხოლოდ მონაცემებზე ორიენტირებული, ის არ არის დაფუძნებული წესებზე. მაგალითად, ჭადრაკში, ფორმულებისა და ჭადრაკის ჩანაწერების დამახსოვრება წესებზეა დაფუძნებული, მაგრამ AlphaGo-სა და AlphaZero-ს მსგავსად, ის აძლევს მოდელს რაციონალურობის უნარს ოპტიმიზაციისა და ძიების გზით. არა მგონია, ამას წესებზე დაფუძნებული ეწოდოს.
ამის გამო, თავად დიდი მოდელი ამჟამად დაკარგულია და მკვლევარები ცდილობენ უზრუნველყონ სწავლაზე ორიენტირებული მოდელი ისეთი მეთოდებით, როგორიცაა CoT. თუმცა, იმ ამოცანებისგან განსხვავებით, რომლებიც საჭიროებენ მხოლოდ მონაცემების საფუძველზე გამოსახულების ამოცნობას და აუხსნელ მიზეზებს, მამოძრავებელი ადამიანის ყოველ მოქმედებას აქვს მკაფიო მამოძრავებელი ძალა.
შესაბამისი ალგორითმის არქიტექტურის დიზაინის მიხედვით, გადაწყვეტილების ტრაექტორია უნდა გახდეს ცვლადი და ერთნაირად ოპტიმიზირებული იყოს სამეცნიერო მიზნების ხელმძღვანელობით, ვიდრე პარამეტრების იძულებით შესწორება და კორექტირება სხვადასხვა შემთხვევების გამოსასწორებლად. ასეთ სისტემას, ბუნებრივია, არ გააჩნია ყველა სახის მკაცრი კოდირებული უცნაური წესები.
დასკვნა
მოკლედ, ბოლოდან ბოლომდე შეიძლება იყოს პერსპექტიული ტექნიკური მარშრუტი, მაგრამ როგორ გამოიყენება კონცეფცია მეტ კვლევას მოითხოვს. მე ვფიქრობ, რომ მონაცემთა და მოდელის პარამეტრების სიმრავლე არ არის ერთადერთი სწორი გამოსავალი და თუ გვინდა, რომ სხვებს გავუსწროთ, უნდა გავაგრძელოთ შრომა.
გამოქვეყნების დრო: აპრ-24-2024