ஒரு இறுதி முதல் இறுதி வரை தன்னாட்சி ஓட்டுநர் அமைப்பை எவ்வாறு வரையறுப்பது?
மிகவும் பொதுவான வரையறை என்னவென்றால், "எண்ட்-டு-எண்ட்" சிஸ்டம் என்பது மூல சென்சார் தகவல்களை உள்ளீடு செய்யும் மற்றும் பணிக்கான கவலையின் மாறிகளை நேரடியாக வெளியிடும் ஒரு அமைப்பாகும். எடுத்துக்காட்டாக, பட அங்கீகாரத்தில், பாரம்பரிய அம்சம் + வகைப்படுத்தி முறையுடன் ஒப்பிடும்போது CNN ஐ "எண்ட்-டு-எண்ட்" என்று அழைக்கலாம்.
தன்னியக்க ஓட்டுநர் பணிகளில், பல்வேறு சென்சார்கள் (கேமராக்கள், LiDAR, ரேடார், அல்லது IMU போன்றவை) தரவு உள்ளீடு ஆகும், மேலும் வாகனக் கட்டுப்பாட்டு சமிக்ஞைகள் (த்ரோட்டில் அல்லது ஸ்டீயரிங் வீல் ஆங்கிள் போன்றவை) நேரடியாக வெளியிடப்படுகின்றன. வெவ்வேறு வாகன மாடல்களின் தழுவல் சிக்கல்களைக் கருத்தில் கொள்ள, வாகனம் ஓட்டும் பாதைக்கு வெளியீட்டையும் தளர்த்தலாம்.
இந்த அடித்தளத்தின் அடிப்படையில், UniAD போன்ற மட்டு எண்ட்-டு-எண்ட் கருத்துகளும் வெளிவந்துள்ளன, இவை இறுதி வெளியீட்டு கட்டுப்பாட்டு சமிக்ஞைகள் அல்லது வழிப்புள்ளிகளுடன் தொடர்புடைய இடைநிலை பணிகளின் மேற்பார்வையை அறிமுகப்படுத்துவதன் மூலம் செயல்திறனை மேம்படுத்துகின்றன. இருப்பினும், அத்தகைய குறுகிய வரையறையிலிருந்து, முடிவில் இருந்து முடிவின் சாராம்சம் உணர்ச்சித் தகவல்களின் இழப்பற்ற பரிமாற்றமாக இருக்க வேண்டும்.
எண்ட்-டு-எண்ட் அல்லாத அமைப்புகளில் உணர்தல் மற்றும் PnC தொகுதிகளுக்கு இடையே உள்ள இடைமுகங்களை முதலில் மதிப்பாய்வு செய்வோம். பொதுவாக, அனுமதிப்பட்டியலில் உள்ள பொருட்களை (கார்கள், நபர்கள் போன்றவை) கண்டறிந்து அவற்றின் பண்புகளை ஆராய்ந்து கணிக்கிறோம். நிலையான சூழல் (சாலை அமைப்பு, வேக வரம்புகள், போக்குவரத்து விளக்குகள் போன்றவை) பற்றியும் அறிந்து கொள்கிறோம். நாம் இன்னும் விரிவாக இருந்தால், உலகளாவிய தடைகளையும் கண்டறிவோம். சுருக்கமாக, இந்த உணர்வுகளின் தகவல் வெளியீடு சிக்கலான ஓட்டுநர் காட்சிகளின் காட்சி மாதிரியை உருவாக்குகிறது.
இருப்பினும், சில வெளிப்படையான காட்சிகளுக்கு, தற்போதைய வெளிப்படையான சுருக்கமானது காட்சியில் ஓட்டும் நடத்தையை பாதிக்கும் காரணிகளை முழுமையாக விவரிக்க முடியாது, அல்லது நாம் வரையறுக்க வேண்டிய பணிகள் மிகவும் அற்பமானவை, மேலும் தேவையான அனைத்து பணிகளையும் கணக்கிடுவது கடினம். எனவே, இந்த தகவலுடன் PnC களில் தானாகவே மற்றும் இழப்பின்றி செயல்படும் நம்பிக்கையுடன் (ஒருவேளை மறைமுகமாக) விரிவான பிரதிநிதித்துவத்தை என்ட்-டு-எண்ட் அமைப்புகள் வழங்குகின்றன. என் கருத்துப்படி, இந்தத் தேவையைப் பூர்த்தி செய்யக்கூடிய அனைத்து அமைப்புகளையும் பொதுமைப்படுத்தப்பட்ட எண்ட்-டு-எண்ட் என்று அழைக்கலாம்.
டைனமிக் இன்டராக்ஷன் காட்சிகளின் சில மேம்படுத்தல்கள் போன்ற பிற சிக்கல்களைப் பொறுத்தவரை, குறைந்தபட்சம் இந்தச் சிக்கல்களைத் தீர்க்க முடியும் என்று நான் நம்புகிறேன். பாரம்பரிய முறைகள் இந்தச் சிக்கல்களைத் தீர்க்க முடியும், நிச்சயமாக, தரவு அளவு போதுமானதாக இருக்கும்போது, இறுதி முதல் இறுதி வரை சிறந்த தீர்வை வழங்கலாம்.
முடிவில் இருந்து இறுதி வரை தன்னியக்க வாகனம் ஓட்டுவது பற்றிய சில தவறான புரிதல்கள்
1. கட்டுப்பாட்டு சிக்னல்கள் மற்றும் வழிப்புள்ளிகள் இறுதியில் இருந்து முடிவாக இருக்க வேண்டும்.
மேலே விவாதிக்கப்பட்ட பரந்த முடிவு முதல் இறுதிக் கருத்துடன் நீங்கள் உடன்பட்டால், இந்த சிக்கலைப் புரிந்துகொள்வது எளிது. பணியின் அளவை நேரடியாக வெளியிடுவதற்குப் பதிலாக, முடிவில் இருந்து இறுதி வரை தகவல் இழப்பற்ற பரிமாற்றத்தை வலியுறுத்த வேண்டும். ஒரு குறுகிய முடிவு முதல் இறுதி வரையிலான அணுகுமுறை தேவையற்ற பிரச்சனைகளை ஏற்படுத்தும் மற்றும் பாதுகாப்பை உறுதி செய்ய நிறைய இரகசிய தீர்வுகள் தேவைப்படும்.
2.எண்ட்-டு-எண்ட் அமைப்பு பெரிய மாதிரிகள் அல்லது தூய பார்வை அடிப்படையில் இருக்க வேண்டும்.
எண்ட்-டு-எண்ட் தன்னாட்சி ஓட்டுநர், பெரிய மாதிரி தன்னியக்க ஓட்டுநர் மற்றும் முற்றிலும் காட்சி தன்னாட்சி ஓட்டுநர் ஆகியவற்றுக்கு இடையே அவசியமான தொடர்பு இல்லை, ஏனெனில் அவை முற்றிலும் சுயாதீனமான கருத்துக்கள்; ஒரு எண்ட்-டு-எண்ட் சிஸ்டம் பெரிய மாடல்களால் இயக்கப்பட வேண்டிய அவசியமில்லை, அது தூய பார்வையால் இயக்கப்பட வேண்டிய அவசியமில்லை. இன்.
3.நீண்ட காலத்தில், மேலே குறிப்பிட்டுள்ள எண்ட்-டு-எண்ட் சிஸ்டம் ஒரு குறுகிய அர்த்தத்தில் எல்3 லெவலுக்கு மேல் தன்னாட்சி ஓட்டத்தை அடைவது சாத்தியமா?
தற்போது Pure end-to-end FSD என அழைக்கப்படும் செயல்திறன், L3 அளவில் தேவைப்படும் நம்பகத்தன்மை மற்றும் நிலைத்தன்மையை பூர்த்தி செய்ய போதுமானதாக இல்லை. இன்னும் வெளிப்படையாகச் சொல்வதென்றால், செல்ஃப் டிரைவிங் சிஸ்டம் மக்களால் ஏற்றுக்கொள்ளப்பட வேண்டுமானால், சில சமயங்களில் இயந்திரம் தவறு செய்யும், அதை மனிதர்கள் எளிதில் தீர்க்க முடியும் என்பதை பொதுமக்கள் ஏற்றுக்கொள்ள முடியுமா என்பதுதான் முக்கியம். தூய எண்ட்-டு-எண்ட் அமைப்புக்கு இது மிகவும் கடினம்.
உதாரணமாக, வட அமெரிக்காவில் உள்ள Waymo மற்றும் Cruise இருவரும் பல விபத்துக்களை சந்தித்துள்ளனர். இருப்பினும், குரூஸின் கடைசி விபத்து இரண்டு காயங்களை ஏற்படுத்தியது, இருப்பினும் இதுபோன்ற விபத்துக்கள் தவிர்க்க முடியாதவை மற்றும் மனித ஓட்டுநர்களுக்கு ஏற்றுக்கொள்ளத்தக்கவை. இருப்பினும், இந்த விபத்திற்குப் பிறகு, கணினி விபத்து நடந்த இடத்தையும், காயமடைந்தவர்களின் இடத்தையும் தவறாகக் கணித்து, புல்-ஓவர் பயன்முறைக்கு தரமிறக்கப்பட்டது, இதனால் காயமடைந்தவர்கள் நீண்ட நேரம் இழுக்கப்படுவார்கள். இந்த நடத்தை எந்த சாதாரண மனித ஓட்டுநராலும் ஏற்றுக்கொள்ள முடியாதது. இது செய்யப்படாது, மேலும் முடிவுகள் மிகவும் மோசமாக இருக்கும்.
மேலும், தன்னாட்சி ஓட்டுநர் அமைப்புகளின் வளர்ச்சி மற்றும் செயல்பாட்டின் போது இந்த சூழ்நிலையை எவ்வாறு தவிர்ப்பது என்பதை நாம் கவனமாக பரிசீலிக்க வேண்டிய எச்சரிக்கை இதுவாகும்.
4.எனவே இந்த நேரத்தில், அடுத்த தலைமுறை வெகுஜன-உற்பத்தி உதவி ஓட்டுநர் அமைப்புகளுக்கான நடைமுறை தீர்வுகள் என்ன?
எனது தற்போதைய புரிதலின்படி, டிரைவிங்கில் எண்ட்-டு-எண்ட் மாடல் என்று அழைக்கப்படும் போது, பாதையை வெளியிட்ட பிறகு, அது பாரம்பரிய முறைகளின் அடிப்படையில் ஒரு தீர்வைத் தரும். மாற்றாக, கற்றல் அடிப்படையிலான திட்டமிடுபவர்கள் மற்றும் பாரம்பரிய பாதை திட்டமிடல் வழிமுறைகள் ஒரே நேரத்தில் பல பாதைகளை வெளியிடுகின்றன, பின்னர் ஒரு தேர்வாளர் மூலம் ஒரு பாதையைத் தேர்ந்தெடுக்கின்றன.
இந்த அமைப்பு கட்டமைப்பு ஏற்றுக்கொள்ளப்பட்டால், இந்த வகையான இரகசிய தீர்வு மற்றும் தேர்வு இந்த அடுக்கு அமைப்பின் செயல்திறனின் மேல் வரம்பை கட்டுப்படுத்துகிறது. இந்த முறை இன்னும் தூய பின்னூட்டக் கற்றலை அடிப்படையாகக் கொண்டால், எதிர்பாராத தோல்விகள் ஏற்படும் மற்றும் பாதுகாப்பாக இருக்க வேண்டும் என்ற இலக்கை அடைய முடியாது.
இந்த வெளியீட்டுப் பாதையில் பாரம்பரிய திட்டமிடல் முறைகளைப் பயன்படுத்தி மீண்டும் மேம்படுத்துதல் அல்லது தேர்ந்தெடுப்பதைக் கருத்தில் கொண்டால், இது கற்றல்-உந்துதல் முறையால் உருவாக்கப்பட்ட பாதைக்கு சமம்; எனவே, இந்த பாதையை நாம் ஏன் நேரடியாக மேம்படுத்தி தேடக்கூடாது?
நிச்சயமாக, சிலர் இத்தகைய தேர்வுமுறை அல்லது தேடல் சிக்கல் குவிந்ததாக இல்லை, ஒரு பெரிய மாநில இடத்தைக் கொண்டுள்ளது மற்றும் வாகனத்தில் உள்ள அமைப்பில் நிகழ்நேரத்தில் இயக்க இயலாது என்று கூறுவார்கள். இந்தக் கேள்வியைக் கவனமாகப் பரிசீலிக்குமாறு அனைவரையும் கேட்டுக்கொள்கிறேன்: கடந்த பத்து ஆண்டுகளில், புலனுணர்வு அமைப்பு குறைந்தபட்சம் நூறு மடங்கு கம்ப்யூட்டிங் சக்தி ஈவுத்தொகையைப் பெற்றுள்ளது, ஆனால் எங்கள் PnC தொகுதி பற்றி என்ன?
சமீபத்திய ஆண்டுகளில் மேம்பட்ட தேர்வுமுறை அல்காரிதம்களில் சில முன்னேற்றங்களுடன் இணைந்து, பெரிய கணினி சக்தியைப் பயன்படுத்த PnC தொகுதியை அனுமதித்தால், இந்த முடிவு இன்னும் சரியானதா? இந்த வகையான பிரச்சனைக்கு, முதல் கொள்கைகளிலிருந்து எது சரியானது என்பதை நாம் கருத்தில் கொள்ள வேண்டும்.
5.தரவு-உந்துதல் மற்றும் பாரம்பரிய முறைகளுக்கு இடையிலான உறவை எவ்வாறு சரிசெய்வது?
செஸ் விளையாடுவது தன்னாட்சி ஓட்டுவதற்கு மிகவும் ஒத்த ஒரு உதாரணம். இந்த ஆண்டு பிப்ரவரியில், டீப்மைண்ட் "தேடல் இல்லாமல் கிராண்ட்மாஸ்டர்-லெவல் செஸ்" என்ற கட்டுரையை வெளியிட்டது, இது தரவு-உந்துதல் மற்றும் MCTS தேடலை AlphaGo மற்றும் AlphaZero இல் கைவிடுவது சாத்தியமா என்று விவாதிக்கிறது. தன்னியக்க ஓட்டுதலைப் போலவே, செயல்களை நேரடியாக வெளியிட ஒரே ஒரு நெட்வொர்க் மட்டுமே பயன்படுத்தப்படுகிறது, அதே நேரத்தில் அனைத்து அடுத்தடுத்த படிகளும் புறக்கணிக்கப்படுகின்றன.
கணிசமான அளவு தரவு மற்றும் மாதிரி அளவுருக்கள் இருந்தபோதிலும், தேடலைப் பயன்படுத்தாமல் நியாயமான முடிவுகளைப் பெற முடியும் என்று கட்டுரை முடிக்கிறது. இருப்பினும், தேடலைப் பயன்படுத்தும் முறைகளுடன் ஒப்பிடும்போது குறிப்பிடத்தக்க வேறுபாடுகள் உள்ளன. சில சிக்கலான எண்ட்கேம்களைக் கையாள்வதற்கு இது மிகவும் பயனுள்ளதாக இருக்கும்.
சிக்கலான காட்சிகள் அல்லது பல-படி கேம்கள் தேவைப்படும் மூலை நிகழ்வுகளுக்கு, இந்த ஒப்புமை இன்னும் பாரம்பரிய மேம்படுத்தல் அல்லது தேடல் அல்காரிதம்களை முற்றிலுமாக கைவிடுவதை கடினமாக்குகிறது. AlphaZero போன்ற பல்வேறு தொழில்நுட்பங்களின் நன்மைகளை நியாயமாகப் பயன்படுத்துவது செயல்திறனை மேம்படுத்துவதற்கான சிறந்த வழியாகும்.
6.பாரம்பரிய முறை = விதி அடிப்படையிலானது வேறு என்றால்?
பலரிடம் பேசும்போது இந்த கருத்தை மீண்டும் மீண்டும் திருத்த வேண்டியிருந்தது. இது முற்றிலும் தரவு உந்துதல் இல்லாத வரை, அது விதி அடிப்படையிலானது அல்ல என்று பலர் நம்புகிறார்கள். எடுத்துக்காட்டாக, சதுரங்கத்தில், வாய்மொழி மூலம் சூத்திரங்கள் மற்றும் சதுரங்கப் பதிவுகளை மனப்பாடம் செய்வது விதி அடிப்படையிலானது, ஆனால் AlphaGo மற்றும் AlphaZero போன்றவை, தேர்வுமுறை மற்றும் தேடலின் மூலம் பகுத்தறிவு திறன் கொண்ட மாதிரியை வழங்குகிறது. இதை விதி அடிப்படையிலானது என்று சொல்ல முடியாது என்று நினைக்கிறேன்.
இதன் காரணமாக, பெரிய மாதிரியே தற்போது காணவில்லை, மேலும் CoT போன்ற முறைகள் மூலம் கற்றல் சார்ந்த மாதிரியை வழங்க ஆராய்ச்சியாளர்கள் முயற்சிக்கின்றனர். இருப்பினும், தூய தரவு-உந்துதல் பட அங்கீகாரம் மற்றும் விவரிக்க முடியாத காரணங்கள் தேவைப்படும் பணிகளைப் போலன்றி, வாகனம் ஓட்டும் நபரின் ஒவ்வொரு செயலும் தெளிவான உந்து சக்தியைக் கொண்டுள்ளது.
பொருத்தமான அல்காரிதம் கட்டிடக்கலை வடிவமைப்பின் கீழ், முடிவுப் பாதை மாறக்கூடியதாக இருக்க வேண்டும் மற்றும் வெவ்வேறு நிகழ்வுகளை சரிசெய்ய அளவுருக்களை வலுக்கட்டாயமாக ஒட்டுதல் மற்றும் சரிசெய்வதை விட, அறிவியல் இலக்குகளின் வழிகாட்டுதலின் கீழ் ஒரே மாதிரியாக உகந்ததாக இருக்க வேண்டும். அத்தகைய அமைப்பில் இயற்கையாகவே அனைத்து வகையான கடினமான-குறியிடப்பட்ட விசித்திரமான விதிகள் இல்லை.
முடிவுரை
சுருக்கமாக, முடிவில் இருந்து இறுதி வரை ஒரு நம்பிக்கைக்குரிய தொழில்நுட்ப வழி இருக்கலாம், ஆனால் கருத்து எவ்வாறு பயன்படுத்தப்படுகிறது என்பது கூடுதல் ஆராய்ச்சி தேவைப்படுகிறது. தரவு மற்றும் மாதிரி அளவுருக்கள் மட்டுமே சரியான தீர்வு அல்ல என்று நான் நினைக்கிறேன், மற்றவர்களை மிஞ்ச விரும்பினால், நாம் கடினமாக உழைக்க வேண்டும்.
பின் நேரம்: ஏப்-24-2024