Skip to main content

Hvad er den optimale kontrolteori?

Optimal kontrolteori bruges stort set i videnskab såvel som teknik.Det er en matematisk optimeringsteknik, der ofte bruges til at skabe kontrolpolitikker.Lev Pontryagin sammen med sit team i det eks-sovjetiske union og den amerikanske Richard Bellman er for det meste ansvarlige for optimal kontrolteori.Det generelle mål med teorien er at bruge forskellige analysemetoder til at bestemme parametrene for et system ved at udføre prøve-og-fejl-processer.

Den optimale kontrolteori er praktisk, når man prøver at løse kontinuerlige tidsoptimeringsproblemer.Teorien tackler et problem ved at bestemme en kontrollov for et hypotetisk system for at opnå et niveau af optimalitet.Den optimale kontrol består af et sæt af forskellige ligninger, der beskriver stierne for de variabler, der bringer omkostningerne funktionelle til et minimum.Omkostningsfunktionel er dybest set en funktion af variabler relateret til tilstand og kontrol.Den optimale kontrolteori gør brug af Pontryagin Maximum -princippet, hvilket generelt siger, at man kan løse optimeringsproblemet P med brugen af en Hamiltonian -funktion H over en periode, hvilket er en nødvendig betingelse.Teorien kan også afledes med Hamilton-Jacobi-Bellman-ligningen.

For at hjælpe en person med at forstå den optimale kontrolteori, bruges ofte "at køre din bil gennem et kuperet vej" -eksempel.Forestil dig at rejse i en bil på en uklar vej i en lige linje.Teorien kan bestemme, hvordan man skal accelerere for at minimere den absolutte rejsetid.I et sådant tilfælde består "systemet" af køretøjet og den stenede vej, og optimalitetskriterierne er ens, der når minimering af rejsetiden.Sådanne problemer vides at omfatte begrænsninger (f.eks. Brændstofbegrænsning, hastighedsgrænser).Et andet spørgsmål er muligvis at finde en måde for bilen at optimere dens forbrug af brændstof, mens den er forpligtet til at gennemføre et bestemt kursus i en given tidsbegrænsning.

Et andet eksempel på brugen af den optimale kontrolteori er løsningen af omkostningsat eller skyggepris.Det består af den marginale værdi af at udvide tilstandsvariablen.Efter at have løst det, kan den optimale værdi for kontrollen danne en differentiel ligning betinget af bevidstheden om omkostningsatet.Det er almindeligt for denne strategi at løse for regioner, der beskriver den optimale kontrol og afsondrer de faktiske valgværdier i tide.