Skip to main content

Hva er den optimale kontrollteorien?

Optimal kontrollteori brukes i stor grad innen vitenskap og ingeniørfag.Det er en matematisk optimaliseringsteknikk som vanligvis brukes til å lage kontrollpolitikk.Lev Pontryagin, sammen med teamet sitt i Ex-Sovjetunionen, og den amerikanske Richard Bellman er stort sett ansvarlige for optimal kontrollteori.Det generelle målet med teorien er å bruke forskjellige analysemetoder for å bestemme parametrene til et system ved å utføre prøve-og-feilingsprosesser.

Den optimale kontrollteorien kommer godt med når du prøver å løse kontinuerlige tidsoptimaliseringsproblemer.Teorien takler et problem ved å bestemme en kontrolllov for et hypotetisk system for å oppnå et nivå av optimalitet.Den optimale kontrollen består av et sett med forskjellige ligninger, som beskriver banene til variablene som gir kostnadsfunksjonell til et minimum.Kostnadsfunksjonen er i utgangspunktet en funksjon av variabler relatert til tilstand og kontroll.Den optimale kontrollteorien bruker maksimumsprinsippet for pontraagin, som generelt sier at man kan løse optimaliseringsproblemet P med bruken av en Hamiltonian -funksjon H over en periode, som er en nødvendig tilstand.Se for deg å reise i en bil på en skummel vei i en rett linje.Teorien kan bestemme hvordan man skal akselerere for å minimere den absolutte reisetiden.I et slikt tilfelle består "systemet" av kjøretøyet og Rocky Road og optimalitetskriteriene er at man når minimering av reisetiden.Slike problemer er kjent for å inkludere begrensninger (f.eks. Begrensning, fartsgrenser).Et annet spørsmål kan være å finne en måte for bilen å optimalisere forbruket av drivstoff mens den er forpliktet til å fullføre et visst kurs i en gitt tidsbegrensning.

Et annet eksempel på bruken av den optimale kontrollteorien er å løse kostnads- eller skyggeprisen.Den består av den marginale verdien av å utvide tilstandsvariabelen.Etter å ha løst at den optimale verdien for kontrollen kan danne en differensialligning betinget av bevisstheten om kostnadene.Det er vanlig at denne strategien løser for regioner som beskriver den optimale kontrollen og tilbaketrukket de faktiske valgverdiene i tid.