Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Adjoint-based algorithms and numerical methods for sensitivity generation and optimization of large scale dynamic systems

Albersmeyer, Jan

German Title: Adjungierten-basierte Algorithmen und numerische Methoden zur Sensitivitätserzeugung und Optimierung großer dynamischer Systeme

[thumbnail of dissertation_published.pdf]
Preview
PDF, English
Download (4MB) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the DOI, URN or the persistent URL below, as we can guarantee their long-time accessibility.

Abstract

This thesis presents advances in numerical methods for the solution of optimal control problems. In particular, the new ideas and methods presented in this thesis contribute to the research fields of structure-exploiting Newton-type methods for large scale nonlinear programming and sensitivity generation for IVPs for ordinary differential equations and differential algebraic equations. Based on these contributions, a new lifted adjoint-based partially reduced exact-Hessian SQP (L-PRSQP) method for nonlinear multistage constrained optimization problems with large scale differential algebraic process models is proposed. It is particularly well suited for optimization problems which involve many state variables in the dynamic process but only few degrees of freedom, i.e., controls, parameter or free initial values. This L-PRSQP method can be understood as an extension of the work of Schäfer to the case of exact-Hessian SQP methods, making use of directional forward/adjoint sensitivities of second order. It stands hence in the tradition of the direct multiple shooting approaches for differential algebraic equations of index 1 of Bock and co-workers. To the novelties that are presented in this thesis further belong - the generalization of the direct multiple shooting idea to structure-exploiting algorithms for NLPs with an internal chain structure of the problem functions, - an algorithmic trick that allows these so-called lifted methods to compute the condensed subproblems directly based on minor modifications to the user given problem functions and without further knowledge on the internal structure of the problem, - a lifted adjoint-based exact-Hessian SQP method that is shown to be equivalent to a full-space approach, but only has the complexity of an unlifted/single shooting approach per iteration, - new adjoint schemes for sensitivity generation based on Internal Numerical Differentiation (IND) for implicit LMMs using the example of Backward Differentiation Formulas (BDF), - the combination of univariate Taylor coefficient (TC) propagation and IND, resulting in IND-TC schemes which allow for the first time the efficient computation of directional forward and forward/adjoint sensitivities of arbitrary order, - a strategy to propagate directional sensitivities of arbitrary order across switching events in the integration, - a local error control strategy for sensitivities and a heuristic global error estimation strategy for IVP solutions in connection with IND schemes, - the software packages DAESOL-II and SolvIND, implementing the ideas related to IVP solution and sensitivity generation, as well as the software packages LiftOpt and DynamicLiftOpt that implement the lifted Newton-type methods for general NLP problems and the L-PRSQP method in the optimal control context, respectively. The performance of the presented approaches is demonstrated by the practical application of our codes to a series of numerical test problems and by comparison to the performance of alternative state-of-the-art approaches, if applicable. In particular, the new lifted adjoint-based partially reduced exact-Hessian SQP method allows the efficient and successful solution of a practical optimal control problem for a binary distillation column, for which the solution using a direct multiple shooting SQP method with an exact-Hessian would have been prohibitively expensive until now.

Translation of abstract (German)

Die vorliegende Arbeit präsentiert Fortschritte in numerischen Methoden zur Lösung von Optimalsteuerungsproblemen. Insbesondere tragen die präsentierten Ideen und Methoden zur Forschung auf den Gebieten der strukturausnutzenden Newton-ähnlichen Verfahren für hochdimensionale nichtlineare Optimierungsprobleme und der Sensitivitätserzeugung für Lösungen von Anfangswertproblemen (AWP) von gewöhnlichen Differentialgleichungen und differentiell-algebraischen Gleichungen bei. Basierend auf diesen Beiträgen wird ein neues, sogenanntes geliftetes, auf adjungierten Sensitivitäten beruhendes, partiell reduziertes SQP-Verfahren mit exakter Hessematrix (L-PRSQP) zur Behandlung mehrstufiger, beschränkter Optimierungsprobleme mit hochdimensionalen Modellen aus differentiell-algebraischen Gleichungen vorgestellt. Dieses eignet sich besonders für Optimierungsprobleme, deren dynamisches Modell viele Zustandsvariablen enthält, und die nur wenige Freiheitsgrade wie Steuerungen, Parameter oder freie Anfangswerte besitzen. Sie kann als eine Erweiterung des Ansatzes von Schäfer auf den Fall von SQP-Verfahren mit exakter Hessematrix verstanden werden, die von kombinierten vorwärts/rückwärts Richtungssensitivitäten zweiter Ordnung Gebrauch macht. Das Verfahren steht damit in der Tradition der von Bock und Mitarbeitern entwickelten direkten Mehrfachschießverfahren für differentiell-algebraische Modelle vom Index 1. Zu den Neuheiten, die in dieser Arbeit vorgestellt werden, gehören weiterhin - die Verallgemeinerung der Idee des direkten Mehrfachschießverfahrens auf strukturausnutzende Algorithmen zur Lösung allgemeiner nichtlinearer Optimierungsprobleme, deren Problemfunktionen eine kettenartige innere Struktur aufweisen, - ein algorithmischer Trick, der es diesen sogenannten gelifteten Verfahren erlaubt, die kondensierten Subprobleme nach kleiner Modifikation der vom Benutzer bereitgestellten Problemfunktionen und ohne weitergehende Kenntnis der inneren Struktur des Problems, direkt zu berechnen, - ein effizientes, geliftetes, auf Adjungierten basierendes SQP-Verfahren mit exakter Hessematrix, von dem die Äquivalenz zur Vollraummethode bewiesen wird, welches aber pro Iteration nur die Komplexität eines ungelifteten Verfahrens/Einfachschießverfahrens aufweist, - neue adjungierte Schemata zur Sensitivitätserzeugung basierend auf Interner Numerischer Differentiation (IND) für implizite lineare Mehrschrittverfahren am Beispiel von BDF-Methoden, - die Kombination von univariater Taylorkoeffizientenpropagation und IND, welche in IND-TC Schemata resultiert, die erstmals die effiziente Berechnung von Richtungssensitivitäten beliebiger Ordnung erlauben, - eine Strategie zur Propagation von Richtungssensitivitäten beliebiger Ordnung durch Schaltpunkte in der Integration hindurch, - eine lokale Fehlerkontrolle für Sensitivitäten und einen heuristischen globalen Fehlerschätzer für die AWP-Lösung, basierend auf den IND Schemata, - die Softwarepakete DAESOL-II und SolvIND, in welchen die Strategien zur AWP-Lösung und Sensitivitätserzeugung implementiert sind, sowie die Pakete LiftOpt und DynamicLiftOpt, welche die gelifteten Newton-ähnlichen Verfahren für allgemeine NLPs beziehungsweise das L-PRSQP-Verfahren im Optimalsteuerungskontext beinhalten. Die Effizienz der vorgestellten Ansätze wird mittels der praktischen Anwendung unserer Softwarepakete auf eine Reihe von numerischen Testproblemen und, wenn möglich, eines Vergleichs mit alternativen state-of-the-art Verfahren demonstriert. Insbesondere erlaubt das neue L-PRSQP-Verfahren eine effiziente und erfolgreiche Behandlung eines praktischen Optimalsteuerungsproblems für eine binäre Destillationskolonne, bei dem der Aufwand der Lösung mittels eines Mehrfachschießverfahrens mit exakter Hessematrix bislang unvertretbar hoch wäre.

Document type: Dissertation
Supervisor: Bock, Prof. Dr. Hans Georg
Date of thesis defense: 23 December 2010
Date Deposited: 17 Mar 2011 14:12
Date: 2010
Faculties / Institutes: Service facilities > Interdisciplinary Center for Scientific Computing
DDC-classification: 510 Mathematics
Controlled Keywords: Optimierung, Nichtkonvexe Optimierung, Nichtlineare Optimierung, Sequentielle quadratische Optimierung, Mehrzielmethode, Schießverfahren
Uncontrolled Keywords: Interne Numerische Differentiation , Taylorkoeffizientenpropagation , Richtungssensitivitäten , Partiell-reduzierte Newton-ähnliche Verfahren, LiftingLifted-Newton , Internal Numerical Differentiation , Directional Sensitivities , Taylor Coefficient Propagation, Partially-reduced Newton-type methods
About | FAQ | Contact | Imprint |
OA-LogoDINI certificate 2013Logo der Open-Archives-Initiative