ਇੱਕ ਸਿਰੇ-ਤੋਂ-ਅੰਤ ਆਟੋਨੋਮਸ ਡ੍ਰਾਈਵਿੰਗ ਸਿਸਟਮ ਨੂੰ ਕਿਵੇਂ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨਾ ਹੈ?
ਸਭ ਤੋਂ ਆਮ ਪਰਿਭਾਸ਼ਾ ਇਹ ਹੈ ਕਿ ਇੱਕ "ਐਂਡ-ਟੂ-ਐਂਡ" ਸਿਸਟਮ ਇੱਕ ਅਜਿਹਾ ਸਿਸਟਮ ਹੈ ਜੋ ਕੱਚੀ ਸੈਂਸਰ ਜਾਣਕਾਰੀ ਨੂੰ ਇਨਪੁਟ ਕਰਦਾ ਹੈ ਅਤੇ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਕੰਮ ਲਈ ਚਿੰਤਾ ਦੇ ਵੇਰੀਏਬਲਾਂ ਨੂੰ ਆਉਟਪੁੱਟ ਕਰਦਾ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਚਿੱਤਰ ਪਛਾਣ ਵਿੱਚ, CNN ਨੂੰ ਰਵਾਇਤੀ ਵਿਸ਼ੇਸ਼ਤਾ + ਵਰਗੀਕਰਣ ਵਿਧੀ ਦੇ ਮੁਕਾਬਲੇ "ਐਂਡ-ਟੂ-ਐਂਡ" ਕਿਹਾ ਜਾ ਸਕਦਾ ਹੈ।
ਆਟੋਨੋਮਸ ਡਰਾਈਵਿੰਗ ਕਾਰਜਾਂ ਵਿੱਚ, ਵੱਖ-ਵੱਖ ਸੈਂਸਰਾਂ (ਜਿਵੇਂ ਕਿ ਕੈਮਰੇ, LiDAR, ਰਾਡਾਰ, ਜਾਂ IMU...) ਤੋਂ ਡਾਟਾ ਇਨਪੁਟ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਵਾਹਨ ਕੰਟਰੋਲ ਸਿਗਨਲ (ਜਿਵੇਂ ਕਿ ਥਰੋਟਲ ਜਾਂ ਸਟੀਅਰਿੰਗ ਵ੍ਹੀਲ ਐਂਗਲ) ਸਿੱਧੇ ਆਉਟਪੁੱਟ ਹੁੰਦੇ ਹਨ। ਵੱਖ-ਵੱਖ ਵਾਹਨ ਮਾਡਲਾਂ ਦੇ ਅਨੁਕੂਲਨ ਮੁੱਦਿਆਂ 'ਤੇ ਵਿਚਾਰ ਕਰਨ ਲਈ, ਆਉਟਪੁੱਟ ਨੂੰ ਵਾਹਨ ਦੇ ਡ੍ਰਾਈਵਿੰਗ ਟ੍ਰੈਜੈਕਟਰੀ ਲਈ ਵੀ ਢਿੱਲ ਦਿੱਤਾ ਜਾ ਸਕਦਾ ਹੈ।
ਇਸ ਬੁਨਿਆਦ ਦੇ ਆਧਾਰ 'ਤੇ, ਮਾਡਿਊਲਰ ਐਂਡ-ਟੂ-ਐਂਡ ਸੰਕਲਪ ਵੀ ਉਭਰ ਕੇ ਸਾਹਮਣੇ ਆਏ ਹਨ, ਜਿਵੇਂ ਕਿ UniAD, ਜੋ ਅੰਤਿਮ ਆਉਟਪੁੱਟ ਕੰਟਰੋਲ ਸਿਗਨਲਾਂ ਜਾਂ ਵੇਅਪੁਆਇੰਟਸ ਤੋਂ ਇਲਾਵਾ, ਸੰਬੰਧਿਤ ਵਿਚਕਾਰਲੇ ਕੰਮਾਂ ਦੀ ਨਿਗਰਾਨੀ ਸ਼ੁਰੂ ਕਰਕੇ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਂਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਅਜਿਹੀ ਤੰਗ ਪਰਿਭਾਸ਼ਾ ਤੋਂ, ਅੰਤ-ਤੋਂ-ਅੰਤ ਦਾ ਸਾਰ ਸੰਵੇਦੀ ਜਾਣਕਾਰੀ ਦਾ ਨੁਕਸਾਨ ਰਹਿਤ ਸੰਚਾਰ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।
ਆਉ ਪਹਿਲਾਂ ਗੈਰ-ਐਂਡ-ਟੂ-ਐਂਡ ਸਿਸਟਮਾਂ ਵਿੱਚ ਸੈਂਸਿੰਗ ਅਤੇ PnC ਮੋਡੀਊਲ ਦੇ ਵਿਚਕਾਰ ਇੰਟਰਫੇਸ ਦੀ ਸਮੀਖਿਆ ਕਰੀਏ। ਆਮ ਤੌਰ 'ਤੇ, ਅਸੀਂ ਵਾਈਟਲਿਸਟ ਕੀਤੀਆਂ ਵਸਤੂਆਂ (ਜਿਵੇਂ ਕਿ ਕਾਰਾਂ, ਲੋਕ, ਆਦਿ) ਦਾ ਪਤਾ ਲਗਾਉਂਦੇ ਹਾਂ ਅਤੇ ਉਹਨਾਂ ਦੀਆਂ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਅਤੇ ਅਨੁਮਾਨ ਲਗਾਉਂਦੇ ਹਾਂ। ਅਸੀਂ ਸਥਿਰ ਵਾਤਾਵਰਣ (ਜਿਵੇਂ ਕਿ ਸੜਕ ਦੀ ਬਣਤਰ, ਸਪੀਡ ਸੀਮਾਵਾਂ, ਟ੍ਰੈਫਿਕ ਲਾਈਟਾਂ, ਆਦਿ) ਬਾਰੇ ਵੀ ਸਿੱਖਦੇ ਹਾਂ। ਜੇਕਰ ਅਸੀਂ ਵਧੇਰੇ ਵਿਸਤ੍ਰਿਤ ਹੁੰਦੇ, ਤਾਂ ਅਸੀਂ ਵਿਸ਼ਵਵਿਆਪੀ ਰੁਕਾਵਟਾਂ ਦਾ ਵੀ ਪਤਾ ਲਗਾਵਾਂਗੇ। ਸੰਖੇਪ ਵਿੱਚ, ਇਹਨਾਂ ਧਾਰਨਾਵਾਂ ਦੁਆਰਾ ਜਾਣਕਾਰੀ ਆਉਟਪੁੱਟ ਗੁੰਝਲਦਾਰ ਡਰਾਈਵਿੰਗ ਦ੍ਰਿਸ਼ਾਂ ਦਾ ਇੱਕ ਡਿਸਪਲੇ ਮਾਡਲ ਬਣਾਉਂਦੀ ਹੈ।
ਹਾਲਾਂਕਿ, ਕੁਝ ਬਹੁਤ ਹੀ ਸਪੱਸ਼ਟ ਦ੍ਰਿਸ਼ਾਂ ਲਈ, ਮੌਜੂਦਾ ਸਪਸ਼ਟ ਐਬਸਟਰੈਕਸ਼ਨ ਉਹਨਾਂ ਕਾਰਕਾਂ ਦਾ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਰਣਨ ਨਹੀਂ ਕਰ ਸਕਦਾ ਹੈ ਜੋ ਸੀਨ ਵਿੱਚ ਡ੍ਰਾਈਵਿੰਗ ਵਿਵਹਾਰ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰਦੇ ਹਨ, ਜਾਂ ਜਿਨ੍ਹਾਂ ਕਾਰਜਾਂ ਨੂੰ ਸਾਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕਰਨ ਦੀ ਲੋੜ ਹੈ ਉਹ ਬਹੁਤ ਮਾਮੂਲੀ ਹਨ, ਅਤੇ ਸਾਰੇ ਲੋੜੀਂਦੇ ਕੰਮਾਂ ਦੀ ਗਿਣਤੀ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੈ। ਇਸਲਈ, ਐਂਡ-ਟੂ-ਐਂਡ ਸਿਸਟਮ ਇਸ ਜਾਣਕਾਰੀ ਦੇ ਨਾਲ PnCs 'ਤੇ ਸਵੈਚਲਿਤ ਅਤੇ ਨੁਕਸਾਨ ਰਹਿਤ ਕੰਮ ਕਰਨ ਦੀ ਉਮੀਦ ਦੇ ਨਾਲ (ਸ਼ਾਇਦ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ) ਵਿਆਪਕ ਪ੍ਰਤੀਨਿਧਤਾ ਪ੍ਰਦਾਨ ਕਰਦੇ ਹਨ। ਮੇਰੀ ਰਾਏ ਵਿੱਚ, ਸਾਰੇ ਸਿਸਟਮ ਜੋ ਇਸ ਲੋੜ ਨੂੰ ਪੂਰਾ ਕਰ ਸਕਦੇ ਹਨ, ਨੂੰ ਜਨਰਲਾਈਜ਼ਡ ਐਂਡ-ਟੂ-ਐਂਡ ਕਿਹਾ ਜਾ ਸਕਦਾ ਹੈ।
ਜਿਵੇਂ ਕਿ ਹੋਰ ਮੁੱਦਿਆਂ ਲਈ, ਜਿਵੇਂ ਕਿ ਗਤੀਸ਼ੀਲ ਪਰਸਪਰ ਕ੍ਰਿਆਵਾਂ ਦੇ ਕੁਝ ਅਨੁਕੂਲਨ, ਮੇਰਾ ਮੰਨਣਾ ਹੈ ਕਿ ਘੱਟੋ ਘੱਟ ਨਾ ਸਿਰਫ ਅੰਤ ਤੋਂ ਅੰਤ ਇਹਨਾਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰ ਸਕਦਾ ਹੈ, ਅਤੇ ਅੰਤ ਤੋਂ ਅੰਤ ਤੱਕ ਸਭ ਤੋਂ ਵਧੀਆ ਹੱਲ ਨਹੀਂ ਹੋ ਸਕਦਾ। ਪਰੰਪਰਾਗਤ ਢੰਗ ਇਹਨਾਂ ਸਮੱਸਿਆਵਾਂ ਨੂੰ ਹੱਲ ਕਰ ਸਕਦੇ ਹਨ, ਅਤੇ ਬੇਸ਼ੱਕ, ਜਦੋਂ ਡੇਟਾ ਦੀ ਮਾਤਰਾ ਕਾਫ਼ੀ ਵੱਡੀ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਅੰਤ-ਤੋਂ-ਅੰਤ ਇੱਕ ਬਿਹਤਰ ਹੱਲ ਪ੍ਰਦਾਨ ਕਰ ਸਕਦਾ ਹੈ।
ਅੰਤ-ਤੋਂ-ਅੰਤ ਆਟੋਨੋਮਸ ਡਰਾਈਵਿੰਗ ਬਾਰੇ ਕੁਝ ਗਲਤਫਹਿਮੀਆਂ
1. ਨਿਯੰਤਰਣ ਸਿਗਨਲ ਅਤੇ ਵੇਅਪੁਆਇੰਟ ਸਿਰੇ ਤੋਂ ਅੰਤ ਤੱਕ ਹੋਣ ਲਈ ਆਉਟਪੁੱਟ ਹੋਣੇ ਚਾਹੀਦੇ ਹਨ।
ਜੇਕਰ ਤੁਸੀਂ ਉੱਪਰ ਦੱਸੇ ਗਏ ਵਿਆਪਕ ਅੰਤ ਤੋਂ ਅੰਤ ਦੇ ਸੰਕਲਪ ਨਾਲ ਸਹਿਮਤ ਹੋ, ਤਾਂ ਇਸ ਸਮੱਸਿਆ ਨੂੰ ਸਮਝਣਾ ਆਸਾਨ ਹੈ। ਐਂਡ-ਟੂ-ਐਂਡ ਨੂੰ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਟਾਸਕ ਵਾਲੀਅਮ ਨੂੰ ਆਊਟਪੁੱਟ ਕਰਨ ਦੀ ਬਜਾਏ ਜਾਣਕਾਰੀ ਦੇ ਨੁਕਸਾਨ ਰਹਿਤ ਪ੍ਰਸਾਰਣ 'ਤੇ ਜ਼ੋਰ ਦੇਣਾ ਚਾਹੀਦਾ ਹੈ। ਇੱਕ ਤੰਗ ਅੰਤ ਤੋਂ ਅੰਤ ਤੱਕ ਪਹੁੰਚ ਬਹੁਤ ਸਾਰੀਆਂ ਬੇਲੋੜੀ ਮੁਸੀਬਤਾਂ ਦਾ ਕਾਰਨ ਬਣੇਗੀ ਅਤੇ ਸੁਰੱਖਿਆ ਨੂੰ ਯਕੀਨੀ ਬਣਾਉਣ ਲਈ ਬਹੁਤ ਸਾਰੇ ਗੁਪਤ ਹੱਲਾਂ ਦੀ ਲੋੜ ਹੋਵੇਗੀ।
2.ਐਂਡ-ਟੂ-ਐਂਡ ਸਿਸਟਮ ਵੱਡੇ ਮਾਡਲਾਂ ਜਾਂ ਸ਼ੁੱਧ ਦ੍ਰਿਸ਼ਟੀ 'ਤੇ ਆਧਾਰਿਤ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ।
ਐਂਡ-ਟੂ-ਐਂਡ ਆਟੋਨੋਮਸ ਡ੍ਰਾਈਵਿੰਗ, ਵੱਡੇ-ਮਾਡਲ ਆਟੋਨੋਮਸ ਡਰਾਈਵਿੰਗ, ਅਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਵਿਜ਼ੂਅਲ ਆਟੋਨੋਮਸ ਡ੍ਰਾਈਵਿੰਗ ਵਿਚਕਾਰ ਕੋਈ ਜ਼ਰੂਰੀ ਸਬੰਧ ਨਹੀਂ ਹੈ ਕਿਉਂਕਿ ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸੁਤੰਤਰ ਸੰਕਲਪ ਹਨ; ਇੱਕ ਐਂਡ-ਟੂ-ਐਂਡ ਸਿਸਟਮ ਜ਼ਰੂਰੀ ਤੌਰ 'ਤੇ ਵੱਡੇ ਮਾਡਲਾਂ ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਨਹੀਂ ਹੁੰਦਾ, ਅਤੇ ਨਾ ਹੀ ਇਹ ਜ਼ਰੂਰੀ ਤੌਰ 'ਤੇ ਸ਼ੁੱਧ ਦ੍ਰਿਸ਼ਟੀ ਦੁਆਰਾ ਚਲਾਇਆ ਜਾਂਦਾ ਹੈ। ਦੇ.
3. ਲੰਬੇ ਸਮੇਂ ਵਿੱਚ, ਕੀ ਉੱਪਰ ਦੱਸੇ ਗਏ ਐਂਡ-ਟੂ-ਐਂਡ ਸਿਸਟਮ ਲਈ ਇੱਕ ਤੰਗ ਅਰਥਾਂ ਵਿੱਚ L3 ਪੱਧਰ ਤੋਂ ਉੱਪਰ ਆਟੋਨੋਮਸ ਡ੍ਰਾਈਵਿੰਗ ਪ੍ਰਾਪਤ ਕਰਨਾ ਸੰਭਵ ਹੈ?
ਜਿਸਨੂੰ ਵਰਤਮਾਨ ਵਿੱਚ ਸ਼ੁੱਧ ਐਂਡ-ਟੂ-ਐਂਡ FSD ਕਿਹਾ ਜਾਂਦਾ ਹੈ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ L3 ਪੱਧਰ 'ਤੇ ਲੋੜੀਂਦੀ ਭਰੋਸੇਯੋਗਤਾ ਅਤੇ ਸਥਿਰਤਾ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ਕਾਫੀ ਨਹੀਂ ਹੈ। ਇਸ ਨੂੰ ਹੋਰ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਕਹਿਣ ਲਈ, ਜੇ ਸਵੈ-ਡਰਾਈਵਿੰਗ ਪ੍ਰਣਾਲੀ ਜਨਤਾ ਦੁਆਰਾ ਸਵੀਕਾਰ ਕੀਤੀ ਜਾਣੀ ਹੈ, ਤਾਂ ਮੁੱਖ ਗੱਲ ਇਹ ਹੈ ਕਿ ਕੀ ਜਨਤਾ ਇਹ ਸਵੀਕਾਰ ਕਰ ਸਕਦੀ ਹੈ ਕਿ ਕੁਝ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਮਸ਼ੀਨ ਗਲਤੀਆਂ ਕਰੇਗੀ, ਅਤੇ ਮਨੁੱਖ ਉਨ੍ਹਾਂ ਨੂੰ ਆਸਾਨੀ ਨਾਲ ਹੱਲ ਕਰ ਸਕਦਾ ਹੈ. ਇਹ ਇੱਕ ਸ਼ੁੱਧ ਅੰਤ-ਤੋਂ-ਅੰਤ ਪ੍ਰਣਾਲੀ ਲਈ ਵਧੇਰੇ ਮੁਸ਼ਕਲ ਹੈ।
ਉਦਾਹਰਨ ਲਈ, ਉੱਤਰੀ ਅਮਰੀਕਾ ਵਿੱਚ ਵੇਮੋ ਅਤੇ ਕਰੂਜ਼ ਦੋਵਾਂ ਵਿੱਚ ਬਹੁਤ ਸਾਰੇ ਹਾਦਸੇ ਹੋਏ ਹਨ। ਹਾਲਾਂਕਿ, ਕਰੂਜ਼ ਦੇ ਆਖਰੀ ਹਾਦਸੇ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਦੋ ਸੱਟਾਂ ਲੱਗੀਆਂ, ਹਾਲਾਂਕਿ ਅਜਿਹੇ ਹਾਦਸੇ ਮਨੁੱਖੀ ਡਰਾਈਵਰਾਂ ਲਈ ਕਾਫ਼ੀ ਅਟੱਲ ਅਤੇ ਸਵੀਕਾਰਯੋਗ ਹਨ। ਹਾਲਾਂਕਿ, ਇਸ ਹਾਦਸੇ ਤੋਂ ਬਾਅਦ, ਸਿਸਟਮ ਨੇ ਦੁਰਘਟਨਾ ਦੀ ਸਥਿਤੀ ਅਤੇ ਜ਼ਖਮੀਆਂ ਦੀ ਸਥਿਤੀ ਬਾਰੇ ਗਲਤ ਅਨੁਮਾਨ ਲਗਾਇਆ ਅਤੇ ਪੁੱਲ-ਓਵਰ ਮੋਡ ਵਿੱਚ ਹੇਠਾਂ ਕਰ ਦਿੱਤਾ, ਜਿਸ ਕਾਰਨ ਜ਼ਖਮੀਆਂ ਨੂੰ ਲੰਬੇ ਸਮੇਂ ਤੱਕ ਖਿੱਚਿਆ ਗਿਆ। ਇਹ ਵਤੀਰਾ ਕਿਸੇ ਵੀ ਆਮ ਮਨੁੱਖੀ ਡਰਾਈਵਰ ਲਈ ਅਸਵੀਕਾਰਨਯੋਗ ਹੈ। ਅਜਿਹਾ ਨਹੀਂ ਕੀਤਾ ਜਾਵੇਗਾ, ਅਤੇ ਨਤੀਜੇ ਬਹੁਤ ਮਾੜੇ ਹੋਣਗੇ।
ਇਸ ਤੋਂ ਇਲਾਵਾ, ਇਹ ਇੱਕ ਵੇਕ-ਅੱਪ ਕਾਲ ਹੈ ਜਿਸ ਬਾਰੇ ਸਾਨੂੰ ਧਿਆਨ ਨਾਲ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਆਟੋਨੋਮਸ ਡਰਾਈਵਿੰਗ ਪ੍ਰਣਾਲੀਆਂ ਦੇ ਵਿਕਾਸ ਅਤੇ ਸੰਚਾਲਨ ਦੌਰਾਨ ਇਸ ਸਥਿਤੀ ਤੋਂ ਕਿਵੇਂ ਬਚਣਾ ਹੈ।
4. ਸੋ ਇਸ ਸਮੇਂ, ਪੁੰਜ-ਉਤਪਾਦਿਤ ਸਹਾਇਕ ਡਰਾਈਵਿੰਗ ਪ੍ਰਣਾਲੀਆਂ ਦੀ ਅਗਲੀ ਪੀੜ੍ਹੀ ਲਈ ਵਿਹਾਰਕ ਹੱਲ ਕੀ ਹਨ?
ਮੇਰੀ ਮੌਜੂਦਾ ਸਮਝ ਦੇ ਅਨੁਸਾਰ, ਜਦੋਂ ਡਰਾਈਵਿੰਗ ਵਿੱਚ ਅਖੌਤੀ ਐਂਡ-ਟੂ-ਐਂਡ ਮਾਡਲ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ, ਟ੍ਰੈਜੈਕਟਰੀ ਨੂੰ ਆਉਟਪੁੱਟ ਕਰਨ ਤੋਂ ਬਾਅਦ, ਇਹ ਰਵਾਇਤੀ ਤਰੀਕਿਆਂ ਦੇ ਅਧਾਰ ਤੇ ਇੱਕ ਹੱਲ ਵਾਪਸ ਕਰੇਗਾ। ਵਿਕਲਪਕ ਤੌਰ 'ਤੇ, ਸਿੱਖਣ-ਅਧਾਰਤ ਯੋਜਨਾਕਾਰ ਅਤੇ ਰਵਾਇਤੀ ਟ੍ਰੈਜੈਕਟਰੀ ਪਲੈਨਿੰਗ ਐਲਗੋਰਿਦਮ ਇੱਕੋ ਸਮੇਂ ਕਈ ਟ੍ਰੈਜੈਕਟਰੀਜ਼ ਨੂੰ ਆਊਟਪੁੱਟ ਕਰਦੇ ਹਨ ਅਤੇ ਫਿਰ ਇੱਕ ਚੋਣਕਾਰ ਦੁਆਰਾ ਇੱਕ ਟ੍ਰੈਜੈਕਟਰੀ ਦੀ ਚੋਣ ਕਰਦੇ ਹਨ।
ਇਸ ਕਿਸਮ ਦਾ ਗੁਪਤ ਹੱਲ ਅਤੇ ਵਿਕਲਪ ਇਸ ਕੈਸਕੇਡ ਸਿਸਟਮ ਦੀ ਕਾਰਗੁਜ਼ਾਰੀ ਦੀ ਉਪਰਲੀ ਸੀਮਾ ਨੂੰ ਸੀਮਿਤ ਕਰਦਾ ਹੈ ਜੇਕਰ ਇਹ ਸਿਸਟਮ ਆਰਕੀਟੈਕਚਰ ਅਪਣਾਇਆ ਜਾਂਦਾ ਹੈ। ਜੇਕਰ ਇਹ ਵਿਧੀ ਅਜੇ ਵੀ ਸ਼ੁੱਧ ਫੀਡਬੈਕ ਸਿੱਖਣ 'ਤੇ ਅਧਾਰਤ ਹੈ, ਤਾਂ ਅਣਪਛਾਤੀ ਅਸਫਲਤਾਵਾਂ ਵਾਪਰਨਗੀਆਂ ਅਤੇ ਸੁਰੱਖਿਅਤ ਰਹਿਣ ਦਾ ਟੀਚਾ ਬਿਲਕੁਲ ਵੀ ਪ੍ਰਾਪਤ ਨਹੀਂ ਹੋਵੇਗਾ।
ਜੇਕਰ ਅਸੀਂ ਇਸ ਆਉਟਪੁੱਟ ਟ੍ਰੈਜੈਕਟਰੀ 'ਤੇ ਰਵਾਇਤੀ ਯੋਜਨਾ ਵਿਧੀਆਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਮੁੜ-ਅਨੁਕੂਲ ਬਣਾਉਣ ਜਾਂ ਚੋਣ ਕਰਨ ਬਾਰੇ ਵਿਚਾਰ ਕਰਦੇ ਹਾਂ, ਤਾਂ ਇਹ ਸਿੱਖਣ-ਸੰਚਾਲਿਤ ਵਿਧੀ ਦੁਆਰਾ ਪੈਦਾ ਕੀਤੇ ਟ੍ਰੈਜੈਕਟਰੀ ਦੇ ਬਰਾਬਰ ਹੈ; ਇਸ ਲਈ, ਅਸੀਂ ਸਿੱਧੇ ਤੌਰ 'ਤੇ ਇਸ ਟ੍ਰੈਜੈਕਟਰੀ ਨੂੰ ਅਨੁਕੂਲਿਤ ਅਤੇ ਖੋਜ ਕਿਉਂ ਨਹੀਂ ਕਰਦੇ?
ਬੇਸ਼ੱਕ, ਕੁਝ ਲੋਕ ਇਹ ਕਹਿਣਗੇ ਕਿ ਅਜਿਹੀ ਅਨੁਕੂਲਤਾ ਜਾਂ ਖੋਜ ਸਮੱਸਿਆ ਗੈਰ-ਉੱਤਲ ਹੈ, ਇੱਕ ਵਿਸ਼ਾਲ ਰਾਜ ਸਪੇਸ ਹੈ, ਅਤੇ ਇੱਕ ਇਨ-ਵਾਹਨ ਸਿਸਟਮ ਤੇ ਅਸਲ-ਸਮੇਂ ਵਿੱਚ ਚਲਾਉਣਾ ਅਸੰਭਵ ਹੈ। ਮੈਂ ਸਾਰਿਆਂ ਨੂੰ ਇਸ ਸਵਾਲ 'ਤੇ ਧਿਆਨ ਨਾਲ ਵਿਚਾਰ ਕਰਨ ਲਈ ਬੇਨਤੀ ਕਰਦਾ ਹਾਂ: ਪਿਛਲੇ ਦਸ ਸਾਲਾਂ ਵਿੱਚ, ਧਾਰਨਾ ਪ੍ਰਣਾਲੀ ਨੂੰ ਘੱਟੋ-ਘੱਟ ਸੌ ਗੁਣਾ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਲਾਭਅੰਸ਼ ਪ੍ਰਾਪਤ ਹੋਇਆ ਹੈ, ਪਰ ਸਾਡੇ PnC ਮੋਡੀਊਲ ਬਾਰੇ ਕੀ?
ਜੇਕਰ ਅਸੀਂ PnC ਮੋਡੀਊਲ ਨੂੰ ਵੱਡੀ ਕੰਪਿਊਟਿੰਗ ਪਾਵਰ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦੇ ਹਾਂ, ਜੋ ਕਿ ਹਾਲ ਹੀ ਦੇ ਸਾਲਾਂ ਵਿੱਚ ਐਡਵਾਂਸਡ ਓਪਟੀਮਾਈਜੇਸ਼ਨ ਐਲਗੋਰਿਦਮ ਵਿੱਚ ਕੁਝ ਤਰੱਕੀ ਦੇ ਨਾਲ ਜੋੜਿਆ ਗਿਆ ਹੈ, ਤਾਂ ਕੀ ਇਹ ਸਿੱਟਾ ਅਜੇ ਵੀ ਸਹੀ ਹੈ? ਇਸ ਤਰ੍ਹਾਂ ਦੀ ਸਮੱਸਿਆ ਲਈ, ਸਾਨੂੰ ਇਹ ਵਿਚਾਰ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ ਕਿ ਪਹਿਲੇ ਸਿਧਾਂਤਾਂ ਤੋਂ ਕੀ ਸਹੀ ਹੈ।
5. ਡੇਟਾ ਦੁਆਰਾ ਸੰਚਾਲਿਤ ਅਤੇ ਪਰੰਪਰਾਗਤ ਤਰੀਕਿਆਂ ਵਿਚਕਾਰ ਸਬੰਧਾਂ ਨੂੰ ਕਿਵੇਂ ਸੁਲਝਾਉਣਾ ਹੈ?
ਸ਼ਤਰੰਜ ਖੇਡਣਾ ਆਟੋਨੋਮਸ ਡ੍ਰਾਈਵਿੰਗ ਵਰਗੀ ਇੱਕ ਉਦਾਹਰਨ ਹੈ। ਇਸ ਸਾਲ ਦੇ ਫਰਵਰੀ ਵਿੱਚ, ਡੀਪਮਾਈਂਡ ਨੇ "ਸਰਚ ਤੋਂ ਬਿਨਾਂ ਗ੍ਰੈਂਡਮਾਸਟਰ-ਲੈਵਲ ਸ਼ਤਰੰਜ" ਨਾਮਕ ਇੱਕ ਲੇਖ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ, ਜਿਸ ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਗਈ ਕਿ ਕੀ ਅਲਫਾਗੋ ਅਤੇ ਅਲਫਾਜ਼ੀਰੋ ਵਿੱਚ ਸਿਰਫ ਡੇਟਾ-ਸੰਚਾਲਿਤ ਵਰਤੋਂ ਅਤੇ MCTS ਖੋਜ ਨੂੰ ਛੱਡਣਾ ਸੰਭਵ ਹੈ। ਆਟੋਨੋਮਸ ਡ੍ਰਾਈਵਿੰਗ ਦੇ ਸਮਾਨ, ਸਿਰਫ ਇੱਕ ਨੈਟਵਰਕ ਨੂੰ ਸਿੱਧੇ ਆਉਟਪੁੱਟ ਐਕਸ਼ਨ ਲਈ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਬਾਅਦ ਦੇ ਸਾਰੇ ਕਦਮਾਂ ਨੂੰ ਅਣਡਿੱਠ ਕੀਤਾ ਜਾਂਦਾ ਹੈ।
ਲੇਖ ਨੇ ਸਿੱਟਾ ਕੱਢਿਆ ਹੈ ਕਿ, ਕਾਫ਼ੀ ਮਾਤਰਾ ਵਿੱਚ ਡੇਟਾ ਅਤੇ ਮਾਡਲ ਪੈਰਾਮੀਟਰਾਂ ਦੇ ਬਾਵਜੂਦ, ਖੋਜ ਦੀ ਵਰਤੋਂ ਕੀਤੇ ਬਿਨਾਂ ਕਾਫ਼ੀ ਵਾਜਬ ਨਤੀਜੇ ਪ੍ਰਾਪਤ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ। ਹਾਲਾਂਕਿ, ਖੋਜ ਦੀ ਵਰਤੋਂ ਕਰਨ ਵਾਲੇ ਤਰੀਕਿਆਂ ਦੇ ਮੁਕਾਬਲੇ ਮਹੱਤਵਪੂਰਨ ਅੰਤਰ ਹਨ. ਇਹ ਕੁਝ ਗੁੰਝਲਦਾਰ ਅੰਤਮ ਖੇਡਾਂ ਨਾਲ ਨਜਿੱਠਣ ਲਈ ਵਿਸ਼ੇਸ਼ ਤੌਰ 'ਤੇ ਲਾਭਦਾਇਕ ਹੈ।
ਗੁੰਝਲਦਾਰ ਦ੍ਰਿਸ਼ਾਂ ਜਾਂ ਕੋਨੇ ਦੇ ਕੇਸਾਂ ਲਈ ਜਿਨ੍ਹਾਂ ਲਈ ਮਲਟੀ-ਸਟੈਪ ਗੇਮਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਇਹ ਸਮਾਨਤਾ ਅਜੇ ਵੀ ਰਵਾਇਤੀ ਓਪਟੀਮਾਈਜੇਸ਼ਨ ਜਾਂ ਖੋਜ ਐਲਗੋਰਿਦਮ ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਛੱਡਣਾ ਮੁਸ਼ਕਲ ਬਣਾਉਂਦੀ ਹੈ। AlphaZero ਵਰਗੀਆਂ ਵੱਖ-ਵੱਖ ਤਕਨਾਲੋਜੀਆਂ ਦੇ ਫਾਇਦਿਆਂ ਦੀ ਉਚਿਤ ਵਰਤੋਂ ਕਰਨਾ ਪ੍ਰਦਰਸ਼ਨ ਨੂੰ ਬਿਹਤਰ ਬਣਾਉਣ ਦਾ ਸਭ ਤੋਂ ਵਧੀਆ ਤਰੀਕਾ ਹੈ।
6. ਪਰੰਪਰਾਗਤ ਵਿਧੀ = ਨਿਯਮ-ਅਧਾਰਿਤ ਜੇਕਰ ਹੋਰ?
ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਨਾਲ ਗੱਲ ਕਰਦੇ ਹੋਏ ਮੈਨੂੰ ਇਸ ਧਾਰਨਾ ਨੂੰ ਬਾਰ ਬਾਰ ਠੀਕ ਕਰਨਾ ਪਿਆ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਲੋਕ ਮੰਨਦੇ ਹਨ ਕਿ ਜਿੰਨਾ ਚਿਰ ਇਹ ਪੂਰੀ ਤਰ੍ਹਾਂ ਡਾਟਾ-ਸੰਚਾਲਿਤ ਨਹੀਂ ਹੈ, ਇਹ ਨਿਯਮ-ਅਧਾਰਿਤ ਨਹੀਂ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਸ਼ਤਰੰਜ ਵਿੱਚ, ਰੋਟ ਦੁਆਰਾ ਫਾਰਮੂਲੇ ਅਤੇ ਸ਼ਤਰੰਜ ਦੇ ਰਿਕਾਰਡਾਂ ਨੂੰ ਯਾਦ ਕਰਨਾ ਨਿਯਮ-ਅਧਾਰਿਤ ਹੈ, ਪਰ ਅਲਫਾਗੋ ਅਤੇ ਅਲਫਾਜ਼ੀਰੋ ਦੀ ਤਰ੍ਹਾਂ, ਇਹ ਮਾਡਲ ਨੂੰ ਅਨੁਕੂਲਤਾ ਅਤੇ ਖੋਜ ਦੁਆਰਾ ਤਰਕਸ਼ੀਲ ਹੋਣ ਦੀ ਯੋਗਤਾ ਦਿੰਦਾ ਹੈ। ਮੈਨੂੰ ਨਹੀਂ ਲੱਗਦਾ ਕਿ ਇਸਨੂੰ ਨਿਯਮ-ਅਧਾਰਿਤ ਕਿਹਾ ਜਾ ਸਕਦਾ ਹੈ।
ਇਸਦੇ ਕਾਰਨ, ਵੱਡਾ ਮਾਡਲ ਇਸ ਸਮੇਂ ਗਾਇਬ ਹੈ, ਅਤੇ ਖੋਜਕਰਤਾ CoT ਵਰਗੇ ਤਰੀਕਿਆਂ ਦੁਆਰਾ ਇੱਕ ਸਿੱਖਣ-ਸੰਚਾਲਿਤ ਮਾਡਲ ਪ੍ਰਦਾਨ ਕਰਨ ਦੀ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹਨ। ਹਾਲਾਂਕਿ, ਉਹਨਾਂ ਕੰਮਾਂ ਦੇ ਉਲਟ ਜਿਹਨਾਂ ਲਈ ਸ਼ੁੱਧ ਡਾਟਾ-ਸੰਚਾਲਿਤ ਚਿੱਤਰ ਮਾਨਤਾ ਅਤੇ ਨਾ ਸਮਝੇ ਜਾਣ ਵਾਲੇ ਕਾਰਨਾਂ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਡ੍ਰਾਈਵਿੰਗ ਕਰਨ ਵਾਲੇ ਵਿਅਕਤੀ ਦੀ ਹਰ ਕਿਰਿਆ ਦੀ ਇੱਕ ਸਪਸ਼ਟ ਡ੍ਰਾਈਵਿੰਗ ਫੋਰਸ ਹੁੰਦੀ ਹੈ।
ਢੁਕਵੇਂ ਐਲਗੋਰਿਦਮ ਆਰਕੀਟੈਕਚਰ ਡਿਜ਼ਾਈਨ ਦੇ ਤਹਿਤ, ਵੱਖ-ਵੱਖ ਮਾਮਲਿਆਂ ਨੂੰ ਠੀਕ ਕਰਨ ਲਈ ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਜ਼ਬਰਦਸਤੀ ਪੈਚ ਕਰਨ ਅਤੇ ਐਡਜਸਟ ਕਰਨ ਦੀ ਬਜਾਏ, ਨਿਰਣਾਇਕ ਟ੍ਰੈਜੈਕਟਰੀ ਪਰਿਵਰਤਨਸ਼ੀਲ ਬਣਨਾ ਚਾਹੀਦਾ ਹੈ ਅਤੇ ਵਿਗਿਆਨਕ ਟੀਚਿਆਂ ਦੇ ਮਾਰਗਦਰਸ਼ਨ ਦੇ ਤਹਿਤ ਇਕਸਾਰ ਅਨੁਕੂਲਿਤ ਹੋਣਾ ਚਾਹੀਦਾ ਹੈ। ਅਜਿਹੀ ਪ੍ਰਣਾਲੀ ਵਿੱਚ ਕੁਦਰਤੀ ਤੌਰ 'ਤੇ ਹਰ ਕਿਸਮ ਦੇ ਹਾਰਡ-ਕੋਡ ਕੀਤੇ ਅਜੀਬ ਨਿਯਮ ਨਹੀਂ ਹੁੰਦੇ ਹਨ।
ਸਿੱਟਾ
ਸੰਖੇਪ ਵਿੱਚ, ਅੰਤ-ਤੋਂ-ਅੰਤ ਇੱਕ ਸ਼ਾਨਦਾਰ ਤਕਨੀਕੀ ਰਸਤਾ ਹੋ ਸਕਦਾ ਹੈ, ਪਰ ਸੰਕਲਪ ਨੂੰ ਕਿਵੇਂ ਲਾਗੂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਇਸ ਲਈ ਹੋਰ ਖੋਜ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਮੈਨੂੰ ਲੱਗਦਾ ਹੈ ਕਿ ਡੇਟਾ ਅਤੇ ਮਾਡਲ ਪੈਰਾਮੀਟਰਾਂ ਦਾ ਇੱਕ ਸਮੂਹ ਹੀ ਸਹੀ ਹੱਲ ਨਹੀਂ ਹੈ, ਅਤੇ ਜੇਕਰ ਅਸੀਂ ਦੂਜਿਆਂ ਨੂੰ ਪਛਾੜਨਾ ਚਾਹੁੰਦੇ ਹਾਂ, ਤਾਂ ਸਾਨੂੰ ਸਖ਼ਤ ਮਿਹਨਤ ਕਰਦੇ ਰਹਿਣਾ ਪਵੇਗਾ।
ਪੋਸਟ ਟਾਈਮ: ਅਪ੍ਰੈਲ-24-2024