अन्त-देखि-अन्त स्वायत्त ड्राइभिङ प्रणाली कसरी परिभाषित गर्ने?
सबैभन्दा सामान्य परिभाषा यो हो कि "अन्त-देखि-अन्त" प्रणाली एक प्रणाली हो जसले कच्चा सेन्सर जानकारी इनपुट गर्दछ र कार्यमा चिन्ताको चरहरू सीधा आउटपुट गर्दछ। उदाहरणका लागि, छवि पहिचानमा, CNN लाई परम्परागत सुविधा + वर्गीकरण विधिको तुलनामा "अन्त-देखि-अन्त" भन्न सकिन्छ।
स्वायत्त ड्राइभिङ कार्यहरूमा, विभिन्न सेन्सरहरूबाट डाटा (जस्तै क्यामेरा, LiDAR, रडार, वा IMU...) इनपुट हुन्छन्, र सवारी साधन नियन्त्रण संकेतहरू (जस्तै थ्रॉटल वा स्टेयरिङ ह्वील कोण) प्रत्यक्ष रूपमा आउटपुट हुन्छन्। विभिन्न वाहन मोडेलहरूको अनुकूलन मुद्दाहरू विचार गर्न, आउटपुटलाई गाडीको ड्राइभिङ ट्र्याजेक्टोरीमा पनि आराम गर्न सकिन्छ।
यस आधारमा आधारित, मोड्युलर अन्त-देखि-अन्त अवधारणाहरू पनि देखा परेका छन्, जस्तै UniAD, जसले अन्तिम आउटपुट नियन्त्रण संकेतहरू वा वेपोइन्टहरू बाहेक सान्दर्भिक मध्यवर्ती कार्यहरूको पर्यवेक्षणको परिचय दिएर कार्यसम्पादन सुधार गर्दछ। यद्यपि, यस्तो संकीर्ण परिभाषाबाट, अन्त-देखि-अन्तको सार संवेदी जानकारीको हानिरहित प्रसारण हुनुपर्छ।
आउनुहोस् पहिले गैर-अन्त-देखि-अन्त प्रणालीहरूमा सेन्सिङ र PnC मोड्युलहरू बीचको इन्टरफेसहरूको समीक्षा गरौं। सामान्यतया, हामी श्वेतसूचीमा राखिएका वस्तुहरू (जस्तै कार, मान्छे, आदि) पत्ता लगाउँछौं र तिनीहरूको गुणहरूको विश्लेषण र भविष्यवाणी गर्छौं। हामी स्थिर वातावरण (जस्तै सडक संरचना, गति सीमा, ट्राफिक बत्ती, आदि) बारे पनि जान्दछौं। यदि हामी थप विस्तृत थियौं भने, हामीले विश्वव्यापी अवरोधहरू पनि पत्ता लगाउन सक्छौं। छोटकरीमा, यी धारणाहरूद्वारा सूचना उत्पादनले जटिल ड्राइभिङ दृश्यहरूको प्रदर्शन मोडेल बनाउँछ।
यद्यपि, केही धेरै स्पष्ट दृश्यहरूको लागि, हालको स्पष्ट अमूर्तताले दृश्यमा ड्राइभिङ व्यवहारलाई असर गर्ने कारकहरूलाई पूर्ण रूपमा वर्णन गर्न सक्दैन, वा हामीले परिभाषित गर्न आवश्यक कार्यहरू धेरै तुच्छ छन्, र सबै आवश्यक कार्यहरू गणना गर्न गाह्रो छ। तसर्थ, अन्त-देखि-अन्त प्रणालीहरूले यस जानकारीको साथ PnC मा स्वचालित रूपमा र हानिरहित रूपमा कार्य गर्ने आशाको साथ (सायद निहित रूपमा) व्यापक प्रतिनिधित्व प्रदान गर्दछ। मेरो विचारमा, यो आवश्यकता पूरा गर्न सक्ने सबै प्रणालीहरूलाई सामान्यीकृत अन्त-देखि-अन्त भन्न सकिन्छ।
अन्य मुद्दाहरूको लागि, जस्तै गतिशील अन्तरक्रिया परिदृश्यहरूको केही अनुकूलनहरू, म विश्वास गर्छु कि कम्तिमा पनि अन्त्य-देखि-अन्तले मात्र यी समस्याहरू समाधान गर्न सक्दैन, र अन्त-देखि-अन्त उत्तम समाधान नहुन सक्छ। परम्परागत विधिहरूले यी समस्याहरू समाधान गर्न सक्छ, र निस्सन्देह, जब डेटाको मात्रा पर्याप्त हुन्छ, अन्त-देखि-अन्तले राम्रो समाधान प्रदान गर्न सक्छ।
अन्त-देखि-अन्त स्वायत्त ड्राइभिङको बारेमा केही गलतफहमीहरू
1. नियन्त्रण संकेतहरू र वेपोइन्टहरू अन्त-देखि-अन्तमा आउटपुट हुनुपर्छ।
यदि तपाईं माथि छलफल गरिएको फराकिलो अन्त-देखि-अन्त अवधारणासँग सहमत हुनुहुन्छ भने, यो समस्या बुझ्न सजिलो छ। अन्त-देखि-अन्तले कार्य भोल्युमलाई सीधा आउटपुट गर्नुको सट्टा जानकारीको हानिरहित प्रसारणमा जोड दिनुपर्दछ। एक साँघुरो अन्त-देखि-अन्त दृष्टिकोणले धेरै अनावश्यक समस्या निम्त्याउनेछ र सुरक्षा सुनिश्चित गर्न धेरै गोप्य समाधानहरू चाहिन्छ।
2. अन्त्य-देखि-अन्त प्रणाली ठूला मोडेल वा शुद्ध दृष्टिमा आधारित हुनुपर्छ।
अन्त-देखि-अन्त स्वायत्त ड्राइभिङ, ठूलो-मोडेल स्वायत्त ड्राइभिङ, र विशुद्ध रूपमा दृश्य स्वायत्त ड्राइभिङ बीच कुनै आवश्यक सम्बन्ध छैन किनभने तिनीहरू पूर्ण रूपमा स्वतन्त्र अवधारणाहरू हुन्; अन्त-देखि-अन्त प्रणाली आवश्यक रूपमा ठूला मोडेलहरूद्वारा संचालित हुँदैन, न त यो शुद्ध दृष्टिद्वारा संचालित हुनुपर्छ। को।
3. लामो अवधिमा, के माथि उल्लिखित अन्त-देखि-अन्त प्रणालीको लागि साँघुरो अर्थमा L3 स्तर माथि स्वायत्त ड्राइभिङ हासिल गर्न सम्भव छ?
हाल शुद्ध अन्त-देखि-अन्त FSD भनिन्छ को प्रदर्शन L3 स्तरमा आवश्यक विश्वसनीयता र स्थिरता पूरा गर्न पर्याप्त छैन। यसलाई अझ स्पष्ट रूपमा भन्नुपर्दा, यदि सेल्फ-ड्राइभिङ प्रणालीलाई जनताले स्वीकार गर्न चाहन्छ भने, कुञ्जी यो हो कि जनताले स्वीकार गर्न सक्छन् कि केहि अवस्थामा, मेसिनले गल्ती गर्छ, र मानिसहरूले सजिलै समाधान गर्न सक्छन्। यो एक शुद्ध अन्त देखि अन्त प्रणाली को लागी अधिक गाह्रो छ।
उदाहरणका लागि, उत्तर अमेरिकामा Waymo र क्रूज दुवैले धेरै दुर्घटनाहरू गरेका छन्। यद्यपि, क्रूजको अन्तिम दुर्घटनामा दुई जना घाइते भएका थिए, यद्यपि त्यस्ता दुर्घटनाहरू मानव चालकहरूको लागि अपरिहार्य र स्वीकार्य छन्। तर, यो दुर्घटना पछि, प्रणालीले दुर्घटनाको स्थान र घाइतेहरूको स्थानलाई गलत अनुमान गरे र पुल ओभर मोडमा डाउनग्रेड गरे, जसले गर्दा घाइतेहरूलाई लामो समयसम्म तानिएको थियो। यो व्यवहार कुनै पनि सामान्य मानव चालकलाई अस्वीकार्य छ। यो गरिने छैन, र परिणाम धेरै खराब हुनेछ।
यसबाहेक, यो एक वेक-अप कल हो जुन हामीले स्वायत्त ड्राइभिङ प्रणालीहरूको विकास र सञ्चालनको क्रममा यस अवस्थाबाट कसरी बच्ने भनेर ध्यानपूर्वक विचार गर्नुपर्छ।
4. त्यसोभए यस क्षणमा, ठूलो-उत्पादित सहायक ड्राइभिङ प्रणालीहरूको अर्को पुस्ताको लागि व्यावहारिक समाधानहरू के छन्?
मेरो हालको बुझाइ अनुसार, ड्राइभिङमा तथाकथित अन्त-देखि-अन्त मोडेल प्रयोग गर्दा, ट्र्याजेक्टोरी आउटपुट गरेपछि, यसले परम्परागत विधिहरूमा आधारित समाधान फर्काउँछ। वैकल्पिक रूपमा, सिकाइमा आधारित योजनाकारहरू र परम्परागत ट्र्याजेक्टोरी प्लानिङ एल्गोरिदमहरूले एकै साथ धेरै ट्र्याजेक्टोरीहरू आउटपुट गर्छन् र त्यसपछि चयनकर्ता मार्फत एउटा ट्र्याजेक्टोरी चयन गर्छन्।
यस प्रकारको गुप्त समाधान र छनौटले यस क्यास्केड प्रणालीको प्रदर्शनको माथिल्लो सीमालाई सीमित गर्दछ यदि यो प्रणाली वास्तुकला अपनाइयो भने। यदि यो विधि अझै पनि शुद्ध प्रतिक्रिया सिकाइमा आधारित छ भने, अप्रत्याशित विफलताहरू हुनेछन् र सुरक्षित हुने लक्ष्य प्राप्त हुनेछैन।
यदि हामीले यस आउटपुट ट्र्याजेक्टोरीमा परम्परागत योजना विधिहरू प्रयोग गरेर पुन: अनुकूलन वा चयन गर्ने विचार गर्छौं भने, यो सिकाइ-संचालित विधिद्वारा उत्पादित ट्र्याजेक्टोरीको बराबर हुन्छ; त्यसोभए, किन हामी यस ट्र्याजेक्टोरीलाई सीधा अप्टिमाइज र खोज गर्दैनौं?
निस्सन्देह, केही व्यक्तिहरूले यस्तो अप्टिमाइजेसन वा खोज समस्या गैर-उत्तल छ, ठूलो राज्य ठाउँ छ, र एक इन-वेहिकल प्रणालीमा वास्तविक समयमा चलाउन असम्भव छ भनी भन्नेछन्। म सबैलाई यस प्रश्नलाई ध्यानपूर्वक विचार गर्न अनुरोध गर्दछु: विगत दस वर्षमा, धारणा प्रणालीले कम्तिमा सय गुणा कम्प्युटिङ पावर लाभांश प्राप्त गरेको छ, तर हाम्रो PnC मोड्युलको बारेमा के हुन्छ?
यदि हामीले PnC मोड्युललाई हालैका वर्षहरूमा उन्नत अप्टिमाइजेसन एल्गोरिदममा भएका केही प्रगतिहरूको साथमा ठूलो कम्प्युटिङ पावर प्रयोग गर्न अनुमति दियौं भने, के यो निष्कर्ष अझै सही छ? यस प्रकारको समस्याको लागि, हामीले पहिलो सिद्धान्तहरूबाट के सही छ भनेर विचार गर्नुपर्छ।
5. डेटा-संचालित र परम्परागत विधिहरू बीचको सम्बन्ध कसरी मिलाउने?
चेस खेल्नु भनेको स्वायत्त ड्राइभिङको जस्तै उदाहरण हो। यस वर्षको फेब्रुअरीमा, Deepmind ले "Grandmaster-Level Chess Without Search" नामक लेख प्रकाशित गर्यो, जसमा अल्फागो र अल्फाजेरोमा मात्र डाटा-संचालित प्रयोग गर्ने र MCTS खोज त्याग्नु सम्भव छ कि छैन भनेर छलफल गर्दै। स्वायत्त ड्राइभिङ जस्तै, सीधा आउटपुट कार्यहरू गर्न केवल एउटा नेटवर्क प्रयोग गरिन्छ, जबकि सबै पछिका चरणहरूलाई बेवास्ता गरिन्छ।
लेखले निष्कर्ष निकाल्छ कि, पर्याप्त मात्रामा डाटा र मोडेल प्यारामिटरहरूको बावजुद, खोजी प्रयोग नगरी नै उचित नतिजाहरू प्राप्त गर्न सकिन्छ। यद्यपि, खोज प्रयोग गर्ने विधिहरूको तुलनामा त्यहाँ महत्त्वपूर्ण भिन्नताहरू छन्। यो केहि जटिल endgames संग व्यवहार को लागी विशेष गरी उपयोगी छ।
जटिल परिदृश्यहरू वा बहु-चरण खेलहरू आवश्यक पर्ने कुना केसहरूको लागि, यो समानताले अझै पनि परम्परागत अनुकूलन वा खोज एल्गोरिदमहरूलाई पूर्ण रूपमा त्याग्न गाह्रो बनाउँछ। AlphaZero जस्ता विभिन्न प्रविधिहरूका फाइदाहरूलाई उचित रूपमा प्रयोग गर्नु कार्यसम्पादन सुधार गर्ने उत्तम तरिका हो।
6. परम्परागत विधि = नियममा आधारित भएमा?
धेरै मानिसहरूसँग कुरा गर्दा मैले यो अवधारणालाई बारम्बार सच्याउनुपर्ने भयो। धेरै मानिसहरू विश्वास गर्छन् कि जबसम्म यो शुद्ध रूपमा डाटा-संचालित हुँदैन, यो नियम-आधारित हुँदैन। उदाहरणका लागि, चेसमा, रोटद्वारा सूत्रहरू र चेस रेकर्डहरू याद गर्नु नियम-आधारित हुन्छ, तर AlphaGo र AlphaZero जस्तै, यसले मोडेललाई अनुकूलन र खोजी मार्फत तर्कसंगत हुन सक्ने क्षमता दिन्छ। यसलाई नियममा आधारित भन्न सकिन्छ जस्तो लाग्दैन ।
यस कारणले गर्दा, ठूलो मोडेल आफैं हाल हराइरहेको छ, र अनुसन्धानकर्ताहरूले CoT जस्ता विधिहरू मार्फत सिकाइ-संचालित मोडेल प्रदान गर्ने प्रयास गरिरहेका छन्। यद्यपि, शुद्ध डेटा-संचालित छवि पहिचान र व्याख्या गर्न नसकिने कारणहरू आवश्यक पर्ने कार्यहरूको विपरीत, ड्राइभिङ गर्ने व्यक्तिको प्रत्येक कार्यमा स्पष्ट ड्राइभिङ बल हुन्छ।
उपयुक्त एल्गोरिथ्म आर्किटेक्चर डिजाइन अन्तर्गत, निर्णय प्रक्षेपण परिवर्तनशील हुनुपर्दछ र वैज्ञानिक लक्ष्यहरूको निर्देशन अन्तर्गत समान रूपमा अनुकूलित हुनुपर्छ, सट्टा जबरजस्ती प्याचिङ र विभिन्न केसहरू ठीक गर्न प्यारामिटरहरू समायोजन गर्नुको सट्टा। यस्तो प्रणालीमा स्वाभाविक रूपमा सबै प्रकारका हार्ड-कोड गरिएका अनौठो नियमहरू हुँदैनन्।
निष्कर्ष
छोटकरीमा, अन्त-देखि-अन्त एक आशाजनक प्राविधिक मार्ग हुन सक्छ, तर अवधारणा कसरी लागू हुन्छ थप अनुसन्धान आवश्यक छ। मलाई लाग्छ डाटा र मोडेल प्यारामिटरहरूको गुच्छा मात्र सही समाधान होइन, र यदि हामी अरूलाई पार गर्न चाहन्छौं भने, हामीले कडा मेहनत गरिरहनुपर्छ।
पोस्ट समय: अप्रिल-24-2024