Tiefes Lernen
Scientific Reports Band 13, Artikelnummer: 7382 (2023) Diesen Artikel zitieren
669 Zugriffe
1 Altmetrisch
Details zu den Metriken
Mikrostrukturen mit technischen Eigenschaften sind für das Wärmemanagement in Luft- und Raumfahrtanwendungen von entscheidender Bedeutung. Aufgrund der überwältigenden Anzahl von Mikrostrukturdesignvariablen können herkömmliche Ansätze zur Materialoptimierung zeitaufwändige Prozesse und begrenzte Anwendungsfälle aufweisen. Hier kombinieren wir ein optisches Ersatz-neuronales Netzwerk mit einem inversen neuronalen Netzwerk und dynamischer Nachbearbeitung, um einen aggregierten inversen Entwurfsprozess für ein neuronales Netzwerk zu bilden. Unser Ersatznetzwerk emuliert Finite-Differenzen-Zeitbereichssimulationen (FDTD), indem es eine Beziehung zwischen der Geometrie, der Wellenlänge, den diskreten Materialeigenschaften und den optischen Ausgabeeigenschaften der Mikrostruktur entwickelt. Der optische Ersatzlöser arbeitet mit einem inversen neuronalen Netzwerk zusammen, um die Designeigenschaften einer Mikrostruktur vorherzusagen, die einem optischen Eingangsspektrum entsprechen. Im Gegensatz zu herkömmlichen Ansätzen, die durch die Materialauswahl eingeschränkt sind, kann unser Netzwerk neue Materialeigenschaften identifizieren, die das Eingabespektrum am besten optimieren und die Ausgabe an ein vorhandenes Material anpassen. Die Ausgabe wird anhand kritischer Designbeschränkungen ausgewertet, in FDTD simuliert und zum erneuten Trainieren des Ersatzes verwendet – wodurch eine selbstlernende Schleife entsteht. Das vorgestellte Framework ist auf das inverse Design verschiedener optischer Mikrostrukturen anwendbar, und der auf Deep Learning basierende Ansatz wird eine komplexe und benutzerbeschränkte Optimierung für die Wärmestrahlungskontrolle in zukünftigen Luft- und Raumfahrtsystemen ermöglichen.
Technische Oberflächen auf mikroskopischer Ebene ermöglichen die Kontrolle über die Materie-Licht-Wechselwirkungen des Materials und sind ein wesentlicher Bestandteil sich entwickelnder Technologien in Bereichen wie passiver Kühlung unter der Umgebungstemperatur1,2,3,4, Strahlungsheizung5,6 und Thermophotovoltaik7,8. Das Design selektiver Emitter für Strahlungswärmemanagementsysteme hängt von zwei photonischen Wellenlängenspektren (λ) ab: dem sichtbaren (VIS) bis zum nahen Infrarot (NIR) und dem mittleren Infrarot (MIR)1,4. Passive Kühlstrukturen – Materialien, die passiv unter Umgebungstemperaturen abkühlen können – sind Oberflächen, die aus Materialien wie Polymeren2,3,9, Verbundwerkstoffen10,11,12 und Graphen13,14 hergestellt werden, um die thermische Emission im MIR zu maximieren und die absorbierte Sonnenstrahlung (λ) zu minimieren = 300–2500 nm) durch Erhöhung der reflektierten Sonnenstrahlung. Methoden wie Nanostrukturierung15, gewellte Strukturen6,16, Kern-Schale-Materialien17,18 und periodische Gitter16,19 können verwendet werden, um den gegenteiligen Effekt hervorzurufen und die Wärmeabsorption zu erhöhen, indem das Antireflexionsverhalten einer Oberfläche verbessert wird. Eine Methode, mit der sowohl Strahlungsheizungs- als auch Strahlungskühlungsmaterialien konstruiert werden können, ist die mikroskalige „Mikropyramiden“-Oberflächentexturierung20. Die Mikropyramidentexturierung ist eine Form des Oberflächenreliefgitters und führt aufgrund der erheblichen Lichteinschränkung durch die Kombination von Material und Geometrie zu Antireflexionseigenschaften20,21,22. Diese Methode kann die Breitband-Antireflexionseigenschaften in Silizium23,24,25,26,27, Metallen5,28,29,30,31,32, Dielektrika33 und Polymeren34 erheblich verbessern.
Das Entwerfen und Optimieren von Strukturen zur selektiven Steuerung optischer Eigenschaften kann eine erhebliche und zeitaufwändige Herausforderung sein. Über das Potenzial für viele Freiheitsgrade im geometrischen Designbereich hinaus sorgt die Materialauswahl für eine zusätzliche Ebene der Komplexität. Die Lösung des Zusammenspiels zwischen einer komplexen Geometrie und Materialauswahl kann sowohl eine erhebliche Investition in Rechenressourcen als auch eine spezielle numerische Methode wie einen Finite-Differenzen-Zeitbereichslöser (FDTD)35 erfordern. Eine hochwirksame Methode, die der Notwendigkeit komplexer Simulationswerkzeuge entgegengewirkt hat, ist der Einsatz von Deep Learning (DL) zur Vorhersage optischer Eigenschaften. DL-Methoden, ein Zweig des maschinellen Lernens (ML), haben gezeigt, dass sie ein hohes Maß an nichtlinearer Abstraktion von Datensätzen36 aufweisen und komplexe Probleme wie selbstfahrende Autos37, Spracherkennung38 und Verarbeitung natürlicher Sprache39 angehen. Deep Learning wurde im Bereich der Photonik und Nanophotonik eingesetzt, um Probleme wie plasmonische Wechselwirkungen36,40, Gitterstrukturen41,42,43, Partikel44,45 und Nanostrukturen46 vorherzusagen und zu modellieren. DL wurde auch im Bereich der Wärmetechnik umfassend eingesetzt, um Themen wie Wärmeleitfähigkeit47, Siedewärmeübertragung48 und Strahlungswärmetransport49,50,51 zu untersuchen.
Deep Learning hat sich nicht nur als wirksam bei der Vorhersage des „Vorwärts“-Problems erwiesen, indem es den optischen Lösungsprozess ersetzt, sondern auch bei der Durchführung eines inversen Designs36,44,45,52,53,54,55,56. Beim inversen Design wird im Großen und Ganzen eine gewünschte Eingabe vorgenommen und eine Reihe von Funktionen ausgegeben, die die Eingabe generieren. Im Vergleich zu herkömmlichen Optimierungstools ist das inverse Design mithilfe maschineller Lernmethoden äußerst effektiv bei der Steigerung des Durchsatzes und der Vorhersagegeschwindigkeit. Es gibt eine Vielzahl von Methoden zur Ausführung eines inversen Entwurfsschemas in der Nanophotonik57, aber einige gängige Methoden umfassen die Verwendung eines Ersatzmodells in Verbindung mit einer Optimierungsmethode58,59, die Erstellung eines „Tandem“- oder bidirektionalen Schemas36,44,55, 60,61 und gegnerische Netzwerke62,63. Auf maschinellem Lernen basierende inverse Entwurfsmethoden wurden auf den Entwurf selektiver Emitterstrukturen angewendet; Methoden, die auf Bildern64, Deep Learning65, Deep-Binary Search66, Transfer Learning67 und genetischen Algorithmen68,69 basieren, haben sich in früheren Studien als wirksam erwiesen. Während einige Studien die Materialauswahl als Ergebnis im inversen Entwurfsprozess berücksichtigen, beschränken sie sich häufig auf eine kleine Menge fester Materialergebnisse44,67.
Die Materialauswahl spielt eine grundlegende Rolle beim Design selektiver Emitter, da die Wechselwirkung von Licht mit der Oberfläche durch die spektralen Materialeigenschaften reguliert wird70. Wenn eine Mikrostruktur oder ein Material nicht in der Lage ist, bestimmte Wellenlängen zu regulieren, kann ein Designer zusätzliche Materialien auftragen, um die Breitbandantwort zu verbessern17,31,32,71, ein neues Verbundmaterial erstellen11,12 oder ein neues Material als Basis auswählen zum Mustern. Daher ist es wichtig, den verfügbaren Materialraum umfassend durchsuchen zu können, um die beste Übereinstimmung für einen bestimmten Satz thermischer Designkriterien zu finden72. Um den inversen Entwurfsansatz vollständig darzustellen, kann die Materialausgabe nicht festgelegt werden und sollte flexibel sein, um die Entdeckung einzigartiger Kombinationen von Materialeigenschaften mit geometrischen Eigenschaften zu ermöglichen.
In dieser Arbeit schlagen wir eine inverse mikrostrukturelle Entwurfsmethode vor, die auf einem neuronalen Tandemnetzwerk basiert, das so konstruiert ist, dass es eine Reihe gewünschter optischer Eigenschaften aufnimmt und eine Reihe von Material- und geometrischen Eigenschaften ausgibt. Wir ergänzen das Tandem-Neuronale Netzwerk – bestehend aus einem Ersatznetzwerk und einem inversen Netzwerk – durch Nachbearbeitungsmethoden, damit das aggregierte Netzwerk kritische physikalische Designbeschränkungen berücksichtigen kann. Das aggregierte Netzwerk ist in einer kontradiktorischen Prozessschleife konzipiert, um es dem Modell zu erleichtern, über nachfolgende Generationen hinweg zu iterieren und auf sich selbst aufzubauen und gezieltes Feedback von den Nachbearbeitungskontrollpunkten zu berücksichtigen. Die Grundlage unserer Methode basiert auf einem zuvor entwickelten optischen Simulationsersatz basierend auf einem tiefen neuronalen Netzwerk (DNN)72. Im Gegensatz zu vielen anderen Studien, die einen Deep-Learning-Ansatz für die Optik bieten, bei dem ein einzelnes Material simuliert wird73, die Materialien fest sind41 oder One-Hot-codiert sind44, schränkt unsere Ersatzmethode die Materialeingabe nicht ein und kann extrapolieren, um Vorhersagen für Materialien zu treffen, die wurden nicht im Training eingesetzt. Die durch diese Methode bereitgestellte Flexibilität ermöglicht es uns, eine inverse neuronale Netzwerkstruktur aufzubauen, die mit dem Ersatz zusammenarbeitet und ebenfalls nicht durch die Materialklassifizierung eingeschränkt ist. Unsere inverse Netzwerkstruktur ist nicht nur in der Lage, ein optimales Material für eine gegebene gewünschte Eingabe vorherzusagen, sondern ist auch in der Lage, neue Materialeigenschaften entsprechend einer gegebenen gewünschten Eingabe zu extrapolieren.
Das von uns demonstrierte Modell nimmt eine einfache Eingabe optischer Eigenschaften über einen Wellenlängenbereich auf und gibt ein Material und eine Mikropyramidengeometrie aus, die am besten dazu passen. Bei der Konstruktion der Methode kommen mehrere Deep-Learning-Methoden zum Einsatz. Wir vergleichen den zuvor etablierten Ersatz eines tiefen neuronalen Netzwerks mit einem bildbasierten Ersatz und integrieren die Funktionalität eines wiederkehrenden neuronalen Netzwerks, um die Vorhersageleistung des inversen Netzwerks zu verbessern. Während wir mit dem Surrogate72 eine begrenzte Optimierung demonstrierten, ermöglicht das inverse Netzwerk eine weitaus schnellere, dynamischere und globalere Optimierung. Die Ausgabe des inversen neuronalen Netzwerks durchläuft eine Nachbearbeitungsphase, in der vom Benutzer festgelegte geometrische und materielle Einschränkungen verwendet werden, um geeignete Lösungen zu erstellen. Die neu generierten Materialeigenschaften werden mit einem Material aus einem Bibliotheksmaterial abgeglichen, die eingeschränkte Ausgabe wird simuliert und die Ergebnisse werden in das Ersatznetzwerk integriert. Mithilfe dieses Prozesses können wir eine Material- und Geometriekombination schnell für ein gewünschtes optisches Spektrum optimieren, und zwar in einem Prozess, der sonst zu rechenintensiv wäre. Während wir unsere Methodik auf Mikropyramidenstrukturen anwenden, kann der von uns demonstrierte Ansatz modifiziert werden, um eine beliebige Anzahl mikrostruktureller Oberflächentopologien zu berücksichtigen.
Abbildung 1 zeigt ein umfassendes Schema des aggregierten neuronalen Netzwerk-Frameworks. Wir unterteilen das Framework in vier Hauptunterkategorien: FDTD-Simulationen, Ersatznetzwerk, inverses neuronales Netzwerk und Nachbearbeitung. Wie in Abb. 1 dargestellt, besteht der allgemeine Prozessablauf darin, dass FDTD-Simulationen verwendet werden, um das Ersatz-Neuronale Netzwerk zu trainieren, und dass der Ersatz verwendet wird, um umfangreiche Vorhersagen zu treffen, die aus einer Materialbibliothek abgeleitet werden. Die Vorhersagen werden dann verwendet, um eine inverse neuronale Netzwerkkomponente zu trainieren. Die Eingabe des inversen Netzwerks ist ein gewünschtes optisches Spektrum (λ, ε, R, T) und die Ausgabe ist die vorhergesagte Basisspanne, Höhe, Substratdicke (Xspan, Zspan und tsub) der Mikropyramide und ein Vektor mit komplexem Brechungsindex Werte (n(λ), k(λ)), die der Eingangswellenlänge entsprechen. Das Nachverarbeitungsmodul interpretiert dann die Ausgabe. Hier werden Benutzerbeschränkungen – wie beispielsweise das maximale Seitenverhältnis – verwendet, um die vorhergesagte Ausgabe anzupassen und geeignete neue Lösungen bereitzustellen, die die Einschränkungen erfüllen. Die angepassten Lösungen werden dann sowohl durch FDTD als auch durch das Ersatzmodell geleitet. Basierend auf zwei Metriken – dem Fehler zwischen der gewünschten Eingabe und der eingeschränkten Ausgabe und dem Fehler zwischen den Ersatz- und FDTD-Ausgaben – wird eine Entscheidung getroffen, entweder den Ersatz mit den neuen Simulationsdaten neu zu trainieren oder die Schleife zu stoppen, wenn die Lösung dies ist als ausreichend und genau erachtet. Alle Details, die in keiner der Hauptunterkategorien für alle Module und Verbindungen behandelt werden, finden Sie im Abschnitt „Methoden“, in den ergänzenden Materialien oder im verlinkten Code-Repository.
Flussdiagrammdarstellung der aggregierten neuronalen Netzwerkmethodik und der inversen Netzwerkarchitektur. In der Ersatzlösung (Vorwärtslösung) generierte Lösungen werden zum Trainieren des Umkehrlösers verwendet. Die Eingabe in das inverse neuronale Netzwerk ist ein 400 × 1-Wellenlängenvektor und das wellenlängenabhängige Emissionsvermögen, Reflexionsvermögen und Transmissionsvermögen. Die Ausgabe des inversen neuronalen Netzwerks ist eine Reihe von Materialeigenschaften, die der eingegebenen Wellenlänge und den geometrischen Eigenschaften entsprechen. Die Ausgabe wird in FDTD ausgewertet und wenn die Ergebnisse gegen vom Benutzer festgelegte Einschränkungen verstoßen, werden alternative Lösungen berechnet, die innerhalb der festgelegten Einschränkungen liegen.
Lösungen mit der FDTD-Methode sind zwar genau, können aber zeitintensiv sein – dies gilt insbesondere für große oder geometrisch komplexe Strukturen. Für diese Arbeit werden die vom Ersatz-Neuronalen Netzwerk verwendeten Trainings-, Validierungs- und Testdaten aus Simulationen zusammengestellt, die im kommerziell erhältlichen 2D/3D-FDTD-Löser von Lumerical durchgeführt wurden. Der Simulationsrahmen liefert exakte Lösungen für Maxwell-Gleichungen über ein Finite-Elemente-Netz, und die Absorption und Dispersion werden aus den resultierenden elektrischen Feldern abgeleitet28,74. Anstatt eine dreidimensionale (3D) Pyramidenmikrostruktur zu simulieren, simulieren wir den mittleren Querschnitt in zwei Dimensionen (2D), um die Simulationszeit zu minimieren und die Generierung großer Mengen an Simulationsdaten zu ermöglichen. Obwohl dies zu einer Überschätzung des Emissionsvermögens der Mikropyramide20 im Vergleich zu den 3D-Mikropyramidensimulationen führt, sind die Ergebnisse dennoch genau, da wir den Einfallswinkel in unseren Simulationen nicht variieren und davon ausgehen, dass die Breitbandwellenlängenquelle in einem normalen Winkel zur Materialoberfläche steht . Darüber hinaus könnten wir zwar einen halbanalytischen Ansatz wie RCWA verwenden, um die Simulationen75 durchzuführen, um die optischen Eigenschaften einer 2D-Struktur abzuschätzen, aber die Genauigkeit, Skalierbarkeit und Anwendbarkeit von FDTD auf andere komplexere Geometrien machen es auf lange Sicht durchaus realisierbar Lösung. Die Simulationen basieren auf einer in Abb. 2 dargestellten Mikropyramidengeometrie, wobei die wichtigsten unabhängigen geometrischen Parameter die Dreiecksbasisspanne (xspan), die Höhe (zspan) und die Substratdicke (tsub) sind. Für diese Arbeit gehen wir davon aus, dass das Kirchhoffsche Gesetz gültig ist und der Emissionsgrad aus α = ε = 1 – R – T abgeleitet werden kann, wobei der Reflexionsgrad (R) und der Transmissionsgrad (T) aus Leistungsmonitoren über und unter der Domäne bzw. berechnet werden wobei Absorptionsgrad (α) gleichbedeutend mit Emissionsgrad (ε)72 ist. Um die Simulationsdatensätze zu entwickeln, die zum Trainieren des Ersatzes verwendet werden, generieren und simulieren wir Matrizen zufällig generierter einheitlicher Werte für xspan, zspan und tsub für jedes enthaltene Material. Der Einfachheit halber gehen wir von keinen zusätzlichen Beschichtungsmaterialien, hierarchischen Strukturen oder Oberflächenrauheiten aus. Weitere Einzelheiten zu unserer FDTD-Simulationsmethodik finden Sie sowohl im Abschnitt „Methoden“ als auch in unseren früheren Arbeiten2,11,20,32.
(a) Bilder für das Faltungs-Neuronale Netzwerk werden unter Verwendung der wellenlängenabhängigen Materialdaten formuliert. Jedes Bild enthält Informationen für einen einzelnen Wellenlängenpunkt. (b) Diagramm des Faltungs-Neuronalen Netzwerkprozesses zur Vorhersage materialabhängiger optischer Eigenschaften aus den erzeugten Bildern.
Deep-Learning-Module haben sich als außergewöhnlich leistungsfähig und vielseitig bei der Lösung des sogenannten „Vorwärts“-Problems erwiesen36,52. In diesem Fall besteht das zu lösende Problem in der optischen Reaktion einer geometrischen und materiellen Eingabe für eine gleichmäßige periodische Mikropyramidenoberfläche. Die Entwurfsabsicht des neuronalen Ersatznetzwerks besteht darin, als ultraschneller und genauer Prädiktor optischer Eigenschaften zu fungieren, sodass wir die optischen Eigenschaften einer großen Anzahl von Simulationen schnell und genau vorhersagen können. Darüber hinaus ist es wichtig, dass das Ersatznetzwerk optische Eigenschaften für Materialien extrapolieren kann, die über seinen ursprünglichen Trainingsumfang hinausgehen. Daher vergleichen wir zwei Methoden, die diese Funktion erfüllen: eine verbesserte Version eines zuvor entwickelten tiefen neuronalen Netzwerks72 und ein bildbasiertes tiefes Faltungs-Neuronales Netzwerk (DCNN). Beide Methoden nutzen in FDTD generierte Datensätze, die in Trainings-, Validierungs- und Testdatensätze unterteilt sind.
Die Architektur des tiefen neuronalen Netzwerks – dargestellt in Abb. 1 unserer vorherigen Arbeit72 und in den ergänzenden Materialien – ist darauf ausgelegt, die kritischen Simulationseingaben zu emulieren, die die berechneten optischen Eigenschaften beeinflussen. Das Netzwerk verwendet insgesamt 8 Eingabeneuronen: 3 geometrische Eingaben (xspan, zspan, tsub), die Quellwellenlänge (λ) und 4 materielle Eingaben (n, k, εreal, εim). Die Substratdicke ist ein wichtiger geometrischer Parameter, der berücksichtigt werden muss, da sie es dem Modell ermöglicht, die Beziehung zwischen den spektralen optischen Eigenschaften und der Dicke des zugrunde liegenden Materials zu interpretieren und letztendlich das breitbandige Spektralverhalten durchlässiger Materialien vorherzusagen. Mikropyramiden aus verschiedenen Materialien werden anhand diskreter Materialeingaben für den komplexen Brechungsindex (n und k) und die korrelierten Permittivitätswerte (εreal, εim) differenziert. Im Vergleich zur Verwendung nur von n und k ist die Verwendung sowohl des komplexen Brechungsindex als auch der Permittivität von entscheidender Bedeutung, um die optischen Eigenschaften von Materialien, die im Trainingsprozess nicht beobachtet wurden, genau zu extrapolieren. Die Wellenlänge (oder Frequenz) der Quelle ist der grundlegende Faktor, der die geometrischen und materiellen Eingaben verknüpft. Für jede FDTD-Simulation simulieren wir 100 Wellenlängenpunkte (100 Frequenzpunkte), von denen jeder eine diskrete Lösung für Reflektivität und Transmissivität hat. Dementsprechend wird jede Simulation in 100 diskrete Eingabevektoren unterteilt, da die Lösung der Maxwell-Gleichungen nicht sequentiell abhängig ist. Um den Zusammenhang zwischen den optischen Eingangs- und Ausgangseigenschaften (R, T) und dem wichtigsten unabhängigen Parameter (λ) zu stärken, verwenden wir zwei kleinere mehrschichtige Perzeptrongruppierungen (MLPs), um die Beziehung zwischen der Geometrie/Wellenlänge und dem getrennt zu betrachten Materialdaten/Wellenlänge. Die MLP-Ausgaben werden verkettet und in ein größeres tiefes neuronales Netzwerk eingespeist, dessen Ausgabe ein Reflexions- und Transmissionswert ist.
Die DNN-Methode ermöglicht sowohl schnelle Vorhersagen als auch genaue Vorhersagen, selbst bei Extrapolationen. Das DNN-Ersatz-Neuronale Netzwerk hat einen mittleren absoluten Fehler (MAE) und einen mittleren quadratischen Fehler (MSE) zwischen den Simulationsdaten und Vorhersagen von 0,0033 bzw. 1,35e-4 für den „Test“-Datensatz – Daten, die vom Training zurückgehalten werden /Validierungsprozess. Da das Design des Netzwerks nicht durch Einschränkungen bei der Materialeingabe eingeschränkt ist, besteht eine grundlegende Bewertung der Leistung des Ersatzes in der Vorhersage der optischen Eigenschaften von Mikrostrukturen aus Materialien, die außerhalb des Schulungsbereichs liegen. Daher bewerten wir das Netzwerk anhand von zwei großen (1500 Simulationen) „ungesehenen“ Datensätzen Al2O3/Ti und anhand von 100 Simulationen von 25 anderen Materialien in einer „Bibliothek“. Wenn die Simulationen aus diesen Datensätzen vom Trainings-/Validierungsprozess völlig unbemerkt bleiben, ergibt das DNN einen MAE zwischen Vorhersage und Simulation von 0,0175, 0,0131 und 0,0279 für die Datensätze der Ti-, Al2O3- und Materialbibliothek. Da die optischen Eigenschaften bereits auf einer Skala von 0 bis 1 liegen, weisen diese Fehler auf eine außergewöhnliche Vorhersagegenauigkeit bei der Extrapolation für neue Materialien hin. Um die Vorhersagegenauigkeit bei der Extrapolation zu verbessern, profitiert das Modell von kleinen „Kalibrierungs“-Datensätzen. Indem wir 5–10 Simulationen aus den „unsichtbaren“ Datensätzen (< 1 %) in den Trainings-/Validierungsprozess des Stellvertreters einbeziehen, reduzieren wir die Vorhersage-MAE auf 0,0073, 0,0049 und 0,0118 für die Ti-, Al2O3- und Materialbibliotheks-Datensätze . Die enthaltenen Simulationen stellen im Vergleich zum ursprünglichen Trainings- und Validierungsdatensatz eine nahezu unbedeutende Anzahl von Simulationen dar (< 0,05 %). Dennoch hat die Einbeziehung dramatische Auswirkungen auf den Rest der extrapolierten Daten, was darauf hindeutet, dass das Modell über ein starkes physikalisches Verständnis verfügt und nur mehrere Simulationen erforderlich sind, um das Modell auf das neue Materialverhalten zu „kalibrieren“. Zusätzlich zur beobachteten Genauigkeit kann das Modell äußerst schnelle Vorhersagen treffen – mit über 1 Million einzelnen Eingabesätzen pro Minute.
Die Architektur einer zweiten vorgeschlagenen Ersatzmethode, die auf Bildverarbeitung basiert, ist in Abb. 2 dargestellt. Hier verbessern wir unsere Designphilosophie für neuronale Netze, den optischen FDTD-Löser nachzuahmen, indem wir ein Netzwerk erstellen, das ein Pseudonetz analysiert. Bei FDTD wird die optische Lösung für eine gegebene Kombination aus Material und Geometrie aus der Lösung der Maxwell-Gleichungen über ein diskretisiertes Netz76 abgeleitet. Die einzige Möglichkeit, wie das Modell zwischen zwei verschiedenen Materialien (z. B. Luft und der Pyramide) unterscheiden kann, besteht darin, jeder Zelle die λ-abhängigen Materialeigenschaften zuzuweisen. Hier nähern wir uns diesem Prozess an, indem wir ein Bild erzeugen, das die spektral abhängigen Material- und Geometrieinformationen nutzt.
Ein Bild ist praktisch nur ein Tensor – wie in Abb. 2 gezeigt, nehmen wir eine dreidimensionale Matrix von Materialinformationen und übersetzen sie in ein Standard-RGB-Bild, wobei jedes Pixel einen Vektor von Materialdaten enthält. Während der Faltungsprozess mit Tensoren höherer oder niedrigerer Ordnung kompatibel ist, verwenden wir zur einfacheren Verwendung und zur Vereinfachung der Datenspeicherung/des Bildgenerators ein standardmäßiges 3-Kanal-Farbbild. Der zum Generieren jedes Bildes verwendete Vektor ist derselbe Vektor mit 8 Eingaben, der im vorherigen Abschnitt beschrieben wurde, mit zwei zusätzlichen statischen Hintergrundmaterialeigenschaften (nbkg = 1 und kbkg = 0). Da die maximalen Xspan- und Zspan-Werte in den Simulationen auf maximal 10 μm festgelegt sind, wird jedes Bild auf effektive 10 × 10 μm eingestellt – wobei die vertikale und horizontale Pixelauflösung die „Zellenlänge“ definiert. Um den Speicherverbrauch zu minimieren, verwenden wir eine 256 × 256-Pixel-Konfiguration. Dies bedeutet effektiv, dass jedes Pixel etwa 40 nm darstellt, was darauf hinweist, dass die minimale Strukturgröße, die wir effektiv darstellen können, etwa 40 nm beträgt. Daher eliminieren wir alle Simulationen mit einer Pyramidenbasisgröße oder -höhe von weniger als 40 nm. Wie in Abb. 2 dargestellt, bauen wir Pyramiden symmetrisch um die Bildmitte und füllen den Rest des Raums symmetrisch aus, bis die Gesamtspannweite der Pyramidenbasis 10 µm beträgt. Beispielsweise füllt eine Pyramide mit einer Grundspannweite von 10 µm die untere horizontale Achse des Bildes perfekt aus. Eine Pyramide mit einer Grundspannweite von 1 µm wird im Bild insgesamt 10 Mal nachgebildet.
Die CDNN-Architektur mit zwei Eingaben wertet zwei Eingaben aus: das generierte Bild und den 8-Eingabe-Vektor mit geometrischen, Material- und Wellenlängeninformationen. Die Bildkomponente wird von einem Faltungs-Neuronalen Netzwerk interpretiert. Das Faltungs-Neuronale Netzwerk besteht aus mehreren „Einheiten“ – jede „Einheit“ enthält eine Faltungsschicht mit einer ReLU-Aktivierungsfunktion (definiert durch Gleichung 1), gefolgt von einer Max-Pooling-Schicht.
Nach mehreren Faltungen mit unterschiedlichen Filterkonfigurationen glätten wir die Ausgabe und wenden vor einer dichten Schicht einen Dropout an, um eine Überanpassung zu begrenzen. Die zweite Komponente, der 8-Eingabe-Vektor, wird als Eingabe für ein tiefes neuronales Netzwerk verwendet. Dieser Eingabevektor enthält Details, die entweder nicht im Bild enthalten sein können (z. B. die Dicke und ausgeschlossene Materialeigenschaften), oder im Bild vorhandene Informationen wie Materialinformationen und Geometrie, um die Interpretations- und Vorhersageleistung des Modells zu verbessern. Die Ausgabe dieses DNN wird mit der Ausgabe des CNN verkettet und dann durch einen letzten Satz dichter verborgener Schichten geleitet. Die Ausgabe des Modells ist dieselbe wie die Ausgabe des DNN – der Reflexions- und Transmissionswert. Genaue Details zum Netzwerkdesign finden Sie im Abschnitt „Methoden“.
Diese Ersatzmethode ist bei der genauen Extrapolation optischer Eigenschaften für neue Materialien effektiver als die reine DNN-Ersatzmethode. Wenn nur 20 % der verfügbaren Simulationsdaten im Trainings-/Validierungs-/Testprozess verwendet werden, können wir die Leistung des DNN erreichen oder übertreffen. Die genaue Leistung hängt von der Auswahl der Materialeigenschaften ab, die in den drei verfügbaren Pixelmatrixdimensionen verwendet werden. Während die Auswahl der ersten Zwei-Pixel-Dimensionen (des komplexen Brechungsindex) unkompliziert ist, war die dritte Größe ein Studienpunkt. In Tabelle 1 zeigen wir die Leistung der CDNN-Architektur bei der Vorhersage der Ti-, Al2O3- und Materialbibliotheksdatensätze, wenn unterschiedliche Mengen in der dritten Matrixdimension verwendet werden. Basierend auf diesen Ergebnissen stellen wir fest, dass die Wellenlänge der effektivste Parameter ist, der in der dritten Dimension verwendet werden kann. Dies ist eine zusätzliche Bestätigung dafür, dass die Wellenlänge ein äußerst wichtiger Parameter ist, damit das Modell ordnungsgemäße Verbindungen zwischen Eingang und Ausgang herstellen kann. Die in Tabelle 1 gezeigten Modellbewertungen werden mit den vollständigen, unsichtbaren Datensätzen durchgeführt. Wir wenden die 20-Prozent-Beschränkung nur auf die Trainingsdaten des Modells an.
Wenn wir dem Modell ermöglichen, den gesamten Simulationsdatensatz im Training zu sehen, den das DNN durchführt (3,55 Eingabevektoren oder 3,55 Millionen Bilder aus 35.500 Simulationen), übertrifft die CDNN-Methode die DNN-Methode deutlich. Die Ti-, Al2O3- und Bibliotheksdatensätze haben einen ausgewerteten MAE von 0,0155, 0,0113 bzw. 0,0226. Wenn wir das Modell mit 10 Simulationen kalibrieren, wie zuvor im DNN gezeigt, sinkt dieser Wert auf 0,0067, 0,0043 bzw. 0,0098. Obwohl es genauer als das DNN ist, ist die Trainings- und Vorhersagezeit für das CDNN aufgrund der relativen Zunahme der Parameter und des Speicherumfangs deutlich länger als für das DNN.
Wir nutzen die schnellen Vorhersagefähigkeiten des Ersatznetzwerks, um iterativ ein neuronales Netzwerk zu trainieren, das das Problem des inversen Designs löst. Das heißt, wir kehren das Vorwärtsproblem um, um vorherzusagen, welches Material und welche Mikrostrukturgeometrie am besten zu einer gewünschten optischen Systemreaktion passen. Die Eingabe dieses Netzwerks ist das spektral abhängige Reflexionsvermögen, die Durchlässigkeit und das Emissionsvermögen, die einem gewünschten Wellenlängenbereich entsprechen.
Die Architektur des inversen neuronalen Netzwerks, wie in Abb. 1 dargestellt, löst das inverse Problem durch Berücksichtigung der gesamten Spektralverteilung. Die Netzwerkeingabe (400 × 1) ist eine vertikal gestapelte Kombination des vorhergesagten Reflexionsvermögens, des Transmissionsvermögens, des abgeleiteten Emissionsvermögens (ε = 1 – R – T) und des Wellenlängenvektors, nach dem die optischen Eigenschaften sequenziert sind. Dementsprechend ist die Ausgabe des inversen Netzwerks eine vertikal gestapelte Kombination aus der geometrischen Eingabe und den wellenlängenabhängigen Materialeigenschaften (n, k, εreal, εim, 403 × 1), wie in Abb. 1 dargestellt. Im Gegensatz zum Ersatznetzwerk können wir die Eingaben nicht trennen eines inversen Netzwerks in einzelne Eingabevektoren. Eine „invertierte“ Lösung für einen einzelnen Satz wellenlängenabhängiger optischer Eigenschaften verfügt über eine unbegrenzte Anzahl möglicher Lösungen. Um ein effektives invertiertes Netzwerk zu entwerfen, muss die Eingabe daher die gesamte Sequenz sein. In unseren ersten Entwurfsiterationen des Ersatzes für ein tiefes neuronales Netzwerk haben wir darüber nachgedacht, die gesamte Sequenz von Wellenlängen/Materialdaten als Eingabe und Reflektivität/Transmissivität als Ausgabe zu verwenden. Während diese Methode effektiv war, da Maxwells Feldgleichungen nicht sequentiell abhängig sind, war der Ersatzlöser viel effektiver, wenn die Sequenzen aufgeteilt wurden und einzelne Vektoren, die auf einem einzelnen Wellenlängenpunkt basierten, als Eingabe verwendet wurden. Diese Methode erweitert auch den Umfang des Trainingssatzes drastisch von 35.500 Simulationen auf 3,55 Millionen Eingabesätze, wodurch eine begrenzte Anzahl von Simulationen effektiver bei der Entwicklung eines Ersatzes mit physikalischen Erkenntnissen wird, der das Vorwärtsproblem genauer lösen kann. Sobald der Ersatz jedoch trainiert ist und genaue Ergebnisse liefern kann, wird die Anzahl der Simulationen trivial, da wir mithilfe des Ersatznetzwerks die Lösungen für 10.000 FDTD-Simulationen (mit jeweils 100 Wellenlängenpunkten) in etwa 60 s effektiv schätzen können.
Um Trainingsdaten für das umgekehrte neuronale Netzwerk zu generieren, übergeben wir große Datengitter zur Vorhersage an das Ersatznetzwerk und fassen die Ausgabe in diskreten Eingabe- und Ausgabesätzen zusammen. Für jedes Material in einer Bibliothek erstellen wir ein Raster mit 200 × 200 geometrischen Kombinationen. Diese Kombinationen werden durch die Vernetzung linear beabstandeter Vektoren für Xspan und Zspan gebildet. Die minimalen und maximalen Werte für diese Vektoren basieren auf dem beobachteten minimalen und maximalen Wert von Xspan und Zspan im Trainingsdatensatz des Stellvertreters. Insgesamt verfügt das Raster über 40.000 geometrische Kombinationen (oder 40.000 Simulationen) für ein einzelnes Material. Für jede geometrische Kombination fügen wir einen Wellenlängenvektor der Länge 100 hinzu, was zu einer Summe von 4 Millionen Eingaben pro Material führt, die an den Ersatz weitergeleitet werden. Während der jeder geometrischen Kombination zugeordnete Wellenlängenvektor ursprünglich ein linear beabstandeter Vektor im Bereich von λ = 0,3 µm bis λ = 16 µm war, stellten wir fest, dass die Verwendung eines linear beabstandeten Wellenlängenvektors mit randomisierten Min/Max-Werten für jede geometrische Kombination die Vielseitigkeit erhöhte des Trainingsdatensatzes und erhöhte dadurch die Robustheit des inversen neuronalen Netzwerks. Alle generierten Gitterdaten werden normalisiert, bevor sie zur Vorhersage an das Ersatznetzwerk übergeben werden. Der letzte nicht-materielle Parameter – die Substratdicke – wird ebenfalls über einen einheitlichen Zufallsgenerierungsprozess randomisiert. Details zum zufälligen Generierungsprozess für die Substratdicke und den Wellenlängenvektor finden Sie im Abschnitt Methoden. Dieser Rastergenerierungsprozess wird für alle Materialien in einer Materialbibliothek wiederholt. Die Materialbibliothek umfasst 50 Materialien. Eine Liste der Materialien und deren Referenzen finden Sie im Zusatzdokument. Die Anzahl der Materialien in der Bibliothek ist leicht skalierbar und stellt eine nicht erschöpfende Darstellung der für eine Mikrostruktur verfügbaren Materialeigenschaften dar. Insgesamt verwenden wir das Ersatznetzwerk, um 2 Millionen Simulationen oder 200 Millionen Eingabesätze zu schätzen. Anschließend sequenzieren wir die vorhergesagten optischen Eigenschaften mithilfe des Wellenlängenvektors (mit der Länge 100) für jede Simulation.
Das inverse Netzwerk enthält drei verschiedene neuronale Netzwerkkomponenten, die so konzipiert sind, dass sie zusammenarbeiten, um eine Geometrie und ein Material zu extrapolieren, die am besten zur gewünschten optischen Reaktion passen. Die erste der Komponenten ist ein tiefes neuronales Netzwerk, das aus mehreren verborgenen Schichten besteht, die den (400 × 1)-Eingabevektor direkt aufnehmen. Auf einer rudimentären Ebene könnte es effektiv sein, einfach die DNN-Struktur des Ersatzes umzukehren – jedoch mit der Progression der Wellenlängen anstelle eines einzelnen Wellenlängenpunkts. Im Laufe unseres Entwicklungsprozesses stellten wir jedoch fest, dass dieser einfachere Ansatz keine physikalischen Erkenntnisse besaß und häufig zu einem nicht physikalisch realisierbaren Ergebnis führte. Obwohl die Lösungen der Maxwell-Gleichungen für eine bestimmte Wellenlänge, ein bestimmtes Material und eine bestimmte Geometrie – das Problem, mit dem sich das Vorwärtsnetzwerk befasst – nicht sequenziell abhängig sind, treten abrupte Änderungen oder Singularitäten der Materialeigenschaften über ein Spektrum hinweg selten auf. Daher ist die Entwicklung von Erkenntnissen über die Beziehung zwischen einer Folge optischer Eingaben und Materialeigenschaften von entscheidender Bedeutung für die Erstellung eines physikalisch fundierten Modells. Um dieses Problem zu lösen, ordnen wir die lineare Abfolge optischer Eigenschaften einer „zeitabhängigen“ Matrix zu und verwenden sie als Eingabe für ein rekurrentes neuronales Netzwerk (RNN). Das heißt, wir bilden den 400 × 1-Vektor von (λ, ε, R, T) in eine 1 × 100 × 4-Matrix (λ, ε(λ), R(λ), T(λ)) ab. Wir wählen Schichten des bidirektionalen Langzeit-Kurzzeitgedächtnisses (LSTM) als konstituierende Komponente des RNN aus. LSTM-Netzwerke sind effektiver als andere RNN-Methoden für weitreichende Abhängigkeiten in Daten77, und die bidirektionalen Attribute ermöglichen es dem Netzwerk, beide Abhängigkeiten in Vorwärts- und Rückwärtsrichtung zu lernen. Darüber hinaus nutzen wir Dropout-Schichten zwischen LSTM-Schichten in Verbindung mit L2-Regularisierung, um eine Überanpassung zu reduzieren. Die Ausgaben der RNN- und DNN-Komponenten werden dann mithilfe einer Matrixmultiplikation kombiniert und in eine dritte Komponente, ein weiteres DNN, eingespeist. Im Gegensatz zur direkten Verknüpfung der Netzwerkausgabe mit den endgültigen DNN/RNN-Schichten ermöglicht ein DNN zwischen diesen beiden Netzwerken und der endgültigen Netzwerkausgabe eine zusätzliche Ebene der nichtlinearen Abstraktion und des Lernens aus den Ausgaben der beiden vorhergehenden neuronalen Netzwerkkomponenten.
Abbildung 3 zeigt die Ausgabe des inversen neuronalen Netzwerks für mehrere Breitbandtesteingaben und Ergebnisse, nachdem die Netzwerkausgaben in FDTD simuliert wurden. Wir verwenden drei thermisch relevante Testspektren als Basisbeurteiler des inversen Netzwerks – Einheitsemissionsgrad, ein ideales Heizemissionsspektrum und ein ideales Kühlspektrum. Diese Emissionsspektren sind in Abb. 3g – i dargestellt. Für diese Testfälle setzen wir die spektrale Transmission auf 0 und R = 1 – ε. In Abb. 3a–c vergleichen wir die vom neuronalen Netzwerk vorhergesagten Materialeigenschaften mit den Materialeigenschaften eines Materials in der Bibliothek, das am besten dazu passt. Die vorhergesagten geometrischen Bedingungen sind in Tabelle 2 angegeben. In allen Fällen stimmen die projizierten Materialeigenschaften in der Bibliothek gut überein. In Abb. 3d–e vergleichen wir die Ergebnisse von FDTD-Simulationen unter Verwendung des vom Netzwerk generierten Materials und des Materials mit der größten Übereinstimmung für dieselbe vorhergesagte optimale Geometrie. Sowohl für den Erwärmungs- als auch für den Einheitsfall beobachten wir, dass das vom neuronalen Netzwerk erzeugte Material das Bibliotheksmaterial übertrifft. Darüber hinaus stellen wir fest, dass sowohl das generierte Material als auch das Bibliotheksmaterial ein Ergebnis liefern, das mit einem hohen Maß an Genauigkeit mit der gewünschten Eingabe übereinstimmt. Dies ist der Fall, obwohl die Eingabe ein nicht-physikalisches Stufenfunktionsverhalten aufweist. Das ideale Kühlspektrum (Abb. 3i) weist eine größere Abweichung zwischen dem gewünschten Spektrum und dem tatsächlichen Ergebnis sowohl für die ML- als auch für die bibliotheksgenerierten Materialien auf. Der beobachtete Fehler wird auf die physikalische Beschränkung der Materialeigenschaften und die Vorgabe einer spektralen Transmission von Null zurückgeführt. Diese Annahme liegt außerhalb der üblichen physikalischen Intuition für den idealen Kühlfall, bei dem aufgrund der physikalischen Materialbeschränkungen die meisten emittierenden Materialien (z. B. TiO2, Al2O3, PDMS usw.) im Infrarotbereich im Ultraviolett (UV) bis zum NIR durchlässig sind Wellenlängen. Somit stellt dies eine Entwurfsherausforderung für ein einzelnes Material dar, um beide Funktionen zu erfüllen, und das inverse neuronale Netzwerk versucht, ein physikalisch begrenztes Material zu abstrahieren, das für eine spektrale Übertragung von Null geeignet ist. Die identifizierten Eigenschaften stimmen über das breitere Spektrum gut überein, erfassen jedoch nicht die beabsichtigte Leistung im sichtbaren bis nahen Infrarotbereich (λ = 0–4 um). Wenn wir die Übertragung in dieser Region zulassen, erhalten wir eine erwartete Ausgabe von PDMS, Einzelheiten dazu finden Sie im Zusatzdokument.
(a–c) Emissionsgradspektren von drei Testfällen (ideale Erwärmung, ideale Kühlung und einheitlicher Emissionsgrad), eingegeben in das inverse Spektrum. Das Reflexionsvermögen wird als R = 1 – E berechnet und das Transmissionsvermögen wird auf 0 gesetzt. (d–f) ML generierte Brechungsindex (n) und Extinktionskoeffizient (k) für jeden Testfall im Vergleich zu den Materialeigenschaften eines Materials in der Bibliothek, die am ehesten dazu passt. (g–i) FDTD-Simulationsergebnisse sowohl für das ML-generierte Material als auch für das am besten passende Bibliotheksmaterial.
Das inverse neuronale Netzwerk ist nicht auf das Breitbanddesign beschränkt. In Abb. 4 zeigen wir, wie das inverse neuronale Netzwerk auf das Schmalband-Mikrostrukturdesign angewendet werden kann. In diesem Fall definieren wir Schmalband als zwei Emissionspunkte mit einem Einheitswert um den beabsichtigten Wellenlängenpeak. Die Ergebnisse des inversen neuronalen Netzwerks für 6 verschiedene Wellenlängenpunkte (1, 2, 3, 4, 5 und 15 um) sind in Abb. 4a – f dargestellt. Das Designergebnis verdeutlicht sowohl die Stärken als auch die Schwächen der vorgestellten inversen neuronalen Netzwerkmethodik. Der geometrische Gestaltungsspielraum ist auf die relativ einfache Mikropyramidengeometrie beschränkt und kann nur ein Material nutzen. Somit bleibt unser Modell mit der implementierten neuronalen Netzwerkarchitektur innerhalb des eingeschränkten und physikalischen Materialverhaltens und versucht, gültige Lösungen zu finden, ohne ein völlig willkürliches Material zu erzeugen. Dies führt zu gültigen Schmalbandlösungen in den niedrigen Wellenlängenbereichen, in denen die Geometrie abgeschwächt werden kann, um plasmonische Resonanz und Resonanzverhalten zu erzeugen. Dieses Verhalten ist besonders deutlich bei den in Abb. 4c,d dargestellten Lösungen, bei denen Spitzen am oder in der Nähe des gewünschten Standorts auftreten, wenn auch entweder mit reduzierter Leistung oder Spitzen jenseits des gewünschten Standorts. Das neuronale Netzwerk kann problemlos Lösungen identifizieren, die physikalisch realisierbar sind, steht jedoch vor der Herausforderung, ein Resonanzverhalten zu finden, das zu schmalbandigen Lösungen für die Wellenlängen im mittleren Infrarot führt. Diese Diagramme resultieren sowohl aus den durch die Eingabe auferlegten physikalischen Einschränkungen, den dem Netzwerk zur Verfügung stehenden Trainingsdaten als auch aus der grundlegenden Physik des Mikropyramidensystems. Trotz dieser Herausforderungen kann gezeigt werden, dass das inverse Netzwerk körperliches Verhalten außerhalb des Rahmens seiner Trainingsdaten erkennt. In Abb. 4d deuten die Vorhersagen des Ersatzmodells nicht auf ein resonantes Schmalbandverhalten bei 4 µm hin, aber bei der Simulation zeigt der Ausgang des inversen neuronalen Netzwerks ein erhebliches Maß an Schmalbandleistung. Dies weist darauf hin, dass das umgekehrte neuronale Netzwerk Lösungen abstrahieren kann, die über die Trainingsdaten hinausgehen, und Verhalten identifizieren kann, das der Ersatz nicht kann, das Netzwerk jedoch immer noch durch die grundlegende Physik eingeschränkt ist.
(a–f) Ergebnisse der Schmalbandsimulation unter Verwendung des inversen neuronalen Netzwerks. Das Eingangsspektrum weist im gesamten Bereich von λ = 0,3 bis 16 µm einen Emissionsgrad von 0,05 auf, mit Ausnahme von zwei Punkten, die den „Peak“-Standort definieren und einen Emissionsgrad von 1 aufweisen. Der Reflexionsgrad wird durch E = 1 – R definiert und die Transmission wird eingestellt auf 0. Die Ergebnisse werden mit der gewünschten Eingabe sowie den Ersatzvorhersagen für dasselbe Material verglichen.
Während die Ausgabe des inversen neuronalen Netzwerks Material- und geometrische Eigenschaften genau vorhersagen kann, die zum gewünschten optischen Spektrum führen, besteht eine wesentliche Einschränkung unserer offenen neuronalen Netzwerkarchitektur darin, dass sie Designbeschränkungen nicht direkt berücksichtigen kann. Dies stellt eine erhebliche Herausforderung dar, den inversen Designprozess funktionsfähig zu machen. Im Idealfall wird unser aggregiertes Netzwerk eine Lösung ausgeben, die in eine fabrizierte Oberflächenmorphologie übersetzbar ist. Diese Herausforderung wird aus den geometrischen Ergebnissen für den idealen Heizfall in Tabelle 2 deutlich; Das Seitenverhältnis der ML-vorhergesagten Struktur beträgt ~ 400 (Zspan/Xspan), was eindeutig eine unpraktische Mikrostruktur ist. Um dieses Problem anzugehen, verwenden wir die Ausgabe des neuronalen Netzwerks und verwenden eine Nachbearbeitungsmethode, um neue Lösungen bereitzustellen, die den vom Benutzer festgelegten Einschränkungen entsprechen. Obwohl es möglich ist, das neuronale Netzwerk selbst durch Methoden wie benutzerdefinierte Aktivierungsfunktionen für die Ausgabeneuronen, die Begrenzung des Eingabedatensatzes oder die Einführung von Grenzen in der Eingabe einzuschränken, entscheiden wir uns für die Nachbearbeitung der Ausgabe des neuronalen Netzwerks, um einen robusten inversen Löser aufrechtzuerhalten . Bei dieser Arbeit konzentrieren wir uns auf die Einschränkung des Seitenverhältnisses, da es eine Schlüsselrolle bei der Bestimmung spielt, ob eine Mikrostruktur herstellbar ist. Andere Einschränkungen, wie etwa die maximale Temperatur eines Materials, Dickenbeschränkungen usw., sind wichtig und können für eine weitergehende Designoptimierung leicht berücksichtigt werden.
Die Nachbearbeitungsmethode besteht aus mehreren Phasen: inverse Vorhersage, Materialanpassung, geometrische Anpassung, Ersatzvorhersage, Simulation und schließlich Ausgabevergleich. Genaue Details zu allen Schritten der Nachbearbeitungsmethode finden Sie im Abschnitt Methoden. Der erste Schritt besteht darin, ein optisches Spektrum aufzunehmen, es durch das inverse Netzwerk zu leiten und einen Satz geometrischer Eigenschaften und spektraler Materialinformationen auszugeben. Von dort aus werden die ML-generierten Materialdaten mit vorhandenen Materialien in der Materialbibliothek verglichen. Anschließend passen wir die ML-generierte Geometrie an, um sie an das festgelegte maximale Seitenverhältnis anzupassen. Anhand der angepassten Geometrie wählen wir zufällig neue eingeschränkte/lebensfähige Geometrien aus und simulieren sie mithilfe des Ersatzes; Die optimalsten Lösungen werden an FDTD übergeben. Die Nachbearbeitungsmethode vergleicht dann die „Ground-Truth“-FDTD sowohl mit der Ersatzausgabe als auch mit der gewünschten Eingabe. Dieser Prozess wird sowohl für das ML-generierte Material als auch für das „beste“ Bibliotheksmaterial durchgeführt und identifiziert eine eingeschränkte Geometrie, die sowohl für das ML-generierte Material als auch für das ausgewählte Bibliotheksmaterial optimal ist.
Abbildung 5a,b zeigt die Anwendung der Nachbearbeitungsmethode zur Auswahl einer neuen praktikablen Lösung für den oben diskutierten idealen Heizfall. Für diese Demonstration zeigen wir Lösungen, wenn das Seitenverhältnis (Z/X) auf 10, 5 und 1 begrenzt ist. Die neuen geometrischen Lösungen werden mithilfe des Ersatzes simuliert und die Ergebnisse werden mit den Vorhersagen für die uneingeschränkte ML-generierte Geometrie verglichen . Verglichen mit dem gewünschten Eingabespektrum haben die eingeschränkten Fälle einen LSE-Wert von 1,229, 1,396 und 1,567 für AR = 10, 5 bzw. 1. Es ist offensichtlich, dass die Ergebnisse bei der Einhaltung des gewünschten Spektrums abnehmen, wenn das Seitenverhältnis begrenzt ist. Aus Abb. 5c geht jedoch auch hervor, dass die Anpassungen der Geometrie zur Berücksichtigung der eingeschränkten Seitenverhältnisbeschränkung immer noch höchst optimale Ergebnisse liefern. Es ist offensichtlich, dass diese Lösungen vom globalen Maximum abweichen, aber unter Einschränkungen immer noch sehr effektiv sind. Wenn die eingeschränkte Lösung als nicht praktikabel genug erachtet wird, können zusätzliche Materialien in die Suche einbezogen werden, wodurch ein fortschrittlicherer Materialabgleichsalgorithmus als bisher verwendet wird20,72.
(a) Beispiel einer vertikalen und (b) horizontalen Neuausrichtung der inversen ML-Ausgabe und anschließender Erzeugung zufällig verteilter Lösungspunkte um die angepasste geometrische Lösung. Das gezeigte Beispiel verwendet eine Seitenverhältnisbeschränkung von 5. Diese Lösungen werden sowohl mit FDTD als auch mit dem Ersatz bewertet. Die optimalste neue Lösung verwendet einen im Abschnitt „Methoden“ beschriebenen Prozess. (c) Der identifizierte optimale Punkt bei jedem Seitenverhältnis wird für jedes Seitenverhältnis angezeigt. Obwohl die Lösung nicht so optimal ist wie die ursprüngliche ML-generierte Geometrie, können wir dennoch geometrische Designs mit außergewöhnlicher Leistung identifizieren.
Durch die Kombination der einzelnen Komponenten bilden wir die in Abb. 1 dargestellte aggregierte Systemschleife. Das aggregierte System ist so konzipiert, dass es aus früheren Fehlern lernen und seine Fähigkeiten und Genauigkeit über nachfolgende Generationen verbessern kann. Trotz der Genauigkeit des bildbasierten Surrogats, insbesondere für unsichtbare Materialien, eliminiert der im Vergleich zum einfacheren Deep Neural Network-Surrogat erforderliche Zeitaufwand für das Training und erneute Trainieren des bildbasierten Faltungsnetzwerks es als Option für das Aggregatsystem. Die für jedes Material generierten Geometrie-/Wellenlängen-Simulationsgitterdaten werden an den DNN-Ersatz übergeben und die daraus resultierenden Vorhersagen bilden die Grundlage für die Trainingsdaten des inversen Netzwerks. Wenn Änderungen am Ersatz vorgenommen werden oder weitere Materialien in die Bibliothek aufgenommen werden, werden die Rasterdaten neu generiert. Anschließend verwenden wir die Breitband- und Schmalband-Testfälle in den Abbildungen. 3 und 4, um die Leistung des inversen Netzwerks bei der Erstellung von Vorhersagen zu testen. Wenn entweder erhebliche Abweichungen zwischen dem gewünschten Ergebnis und dem tatsächlichen Ergebnis auftreten oder die Ersatzvorhersage erheblich von den FDTD-Ergebnissen abweicht, führen wir zusätzliche Simulationen über unsere Methode zur Generierung von Post-Processing-Lösungen durch. Diese Ergebnisse werden in die Trainingsdaten für das Surrogat integriert und das Surrogat/inverse Netzwerk wird neu trainiert. Die Nachbearbeitung erfüllt dann eine zusätzliche Funktion als pseudo-gegnerischer Kontrollpunkt, an dem die generierten Ergebnisse mit den tatsächlichen Ergebnissen verglichen werden und bei einem unerwünschten Ergebnis das Netzwerk mit neuen Simulationsinformationen neu trainiert wird.
Eine zentrale Herausforderung beim Entwurf von Mikrostrukturen ist der Zeitaufwand für die Simulation und Optimierung eines Entwurfs. Was die erste Komponente betrifft, kann ein neuronales Netzwerk im krassen Gegensatz zu einem FDTD-Löser vergleichsweise augenblicklich Vorhersagen treffen. Die Generierung der etwa 40.000 FDTD-Simulationen, die zum Trainieren, Testen und Bewerten unseres Ersatznetzwerks verwendet werden, erforderte Monate Rechenzeit, wohingegen das Ersatznetzwerk ein 40.000 Simulationsgitter (4 Millionen Sätze) in etwa 4–5 Minuten vorhersagen kann. Das DNN-Ersatznetzwerk kann eine Punktsimulation mit 100 Wellenlängen in etwa 6 ms vorhersagen, was einer Geschwindigkeitssteigerung von 4 bis 6 Größenordnungen im Vergleich zur Verwendung des FDTD-Lösers für dieselbe Aufgabe entspricht. Angesichts der nachgewiesenen Genauigkeit des Netzwerks über eine Materialbibliothek hinweg ist diese Methode äußerst effektiv, da sie den Bedarf an komplexen optischen Lösern zur Schätzung spektraler optischer Eigenschaften über eine große Materialbibliothek hinweg erheblich reduziert. Wie bereits gezeigt, sind, sobald das Modell einen Bezug zur Physik des Problems hat, nur sehr wenige Simulationen erforderlich, um das Modell auf neue Materialien zu „kalibrieren“. Unser DNN-Ersatz erfordert lediglich die Einbeziehung von durchschnittlich 5–20 FDTD-Simulationen in das Training pro Material, um den Vorhersagefehler für dieses Material dem Rest des Datensatzes anzunähern.
Ein grundlegender Vorteil des Ersatznetzwerks im Vergleich zu FDTD-Simulationen – die Geschwindigkeit – wird in dieser Arbeit genutzt, um einen umfassenden Datensatz für das Training eines inversen Lösers zu erstellen, der darauf abzielt, wichtige Herausforderungen bei der Designoptimierung anzugehen. In unseren früheren Veröffentlichungen haben wir uns mit der Optimierung mithilfe einer thermischen Gütezahl und einer „Brute Force“-Optimierungsmethode befasst. Das heißt, wir haben eine Zielfunktion entworfen, um ein gewünschtes Spektrum zu beschreiben, und verwenden die FDTD oder den optischen Ersatzausgang, um die thermischen Gleichungen zu lösen, und verwenden dann die Zielfunktion, um zu bestimmen, welches Spektrum am besten zum Eingang passt. Diese Methode ist offensichtlich unglaublich langsam und umständlich. Die Verwendung eines neuronalen Netzwerks zur Ausführung der inversen Aufgabe ist – ähnlich wie das Vorwärtslösungsnetzwerk – um Größenordnungen schneller als dieser Ansatz. Der Geschwindigkeitsunterschied beruht auf der Tatsache, dass das inverse neuronale Netzwerk das Muster zwischen den optischen Eigenschaften und den Material-/Geometrieeigenschaften lernen und direkt ein Spektrum aufnehmen und ein passendes Material/eine passende Geometrie ausgeben kann. Anstelle einer Umwegmethode, die auf der Identifizierung des besten Spektrums mithilfe von Gittern aus ersatzgenerierten Daten über mehrere Materialien beruht, trainiert das inverse Netzwerk auf diesen Gittern und bietet dem Benutzer eine nahezu sofortige Ausgabe eines ausgewählten Spektrums. Diese Methode öffnet auch die Tür zu nicht intuitiven Lösungen, da wir möglicherweise neue Materialien identifizieren können, die nicht in der Materialbibliothek enthalten sind.
Die Bestimmung der geeigneten Ersatzmethode zur Generierung der Trainingsdaten für die inversen Daten ist ein wichtiger Gesichtspunkt beim Entwurf des Aggregatsystems. Letztendlich erfordert das inverse Netzwerk aufgrund der großen Datengitter, die zur Generierung der Trainingsdaten und des Trainings-/Umschulungsprozesses verwendet werden, einen schnellen Ersatz. Die DNN-Methodik ist im Vergleich zur CNN-Methodik bei der Erstellung von Vorhersagen und beim Training deutlich schneller. Wenn der bildbasierte Ansatz mit dem gesamten Datensatz trainiert wird, kann das Training mit unseren Rechenressourcen Hunderte von Stunden dauern. Im Vergleich dazu kann das DNN den gesamten Datensatz in etwa 25–50 Stunden trainieren. Darüber hinaus ist die Vorhersagezeit für das CDNN deutlich länger, was die Generierung von Simulationsdaten zum Trainieren des inversen Netzwerks weitaus weniger effizient macht. Obwohl die CDNN-Methode genauer ist, rechtfertigt die von uns beobachtete inkrementelle Genauigkeitssteigerung in diesem Fall nicht den Zeitaufwand. Wir könnten die Größe der vom CDNN verwendeten Bilder reduzieren, um die Trainings- und Vorhersagezeiten des Netzwerks zu beschleunigen, aber dann würden wir die räumliche Auflösung verlieren und müssten eine größere Menge an Simulationen aus der Betrachtung ausschließen. Die Wirksamkeit des CDNN wird in zukünftigen Arbeiten deutlicher, die auf komplexeren Strukturen basieren. Die als Eingabe verwendeten Bilder sind nicht spezifisch an eine einzelne Geometrie gebunden, und es könnte ein CDNN-Ersatz konstruiert werden, der die optischen Eigenschaften verschiedener Geometrien oder sogar abstrakter Formen löst. Dies könnte auch mehrere Geometrien, Hierarchien oder sogar Strukturen umfassen, die mehrere Materialien umfassen, wie beispielsweise beschichtete Strukturen oder Verbundstrukturen. Zusätzlich zu diesen Optionen könnte ein CDNN auch in einen Tandem-Inverslöser mit einem generativen Netzwerk umgewandelt werden. Obwohl die Mikropyramidengeometrie, die wir in der vorliegenden Arbeit zeigen, relativ einfach ist und keinen bildbasierten Ersatz zum Trainieren des inversen Netzwerks erfordert, sind die potenziellen zukünftigen Optionen für komplexe inverse neuronale Netzwerke, die auf einem „bildabgeleiteten Netz“ basieren, grenzenlos.
Die Hauptstärke des inversen neuronalen Netzwerkdesigns – seine Fähigkeit, einen einzigartigen Satz spektraler Materialeigenschaften zu erzeugen – führt zu erheblichen Design- und Implementierungsherausforderungen. Ein zentrales Anliegen bei der Gestaltung des Netzwerks besteht darin, zu bestimmen, wie der Wunsch, physisch begrenzt zu bleiben, in Einklang gebracht werden kann und gleichzeitig dem Modell ermöglicht wird, Wege zu finden, auf neue und einzigartige Weise zu extrapolieren. Ein einfacher Ansatz wäre die einfache One-Hot-Kodierung von Materialklassifizierungen gewesen, wodurch nicht-physische Materialausgaben eliminiert worden wären. Dieser Ansatz ist unerwünscht, da dadurch nicht nur die Möglichkeit zur Extrapolation neuer Materialien entfällt, sondern auch die Möglichkeit, verschiedene Materialien in der Nachbearbeitung zu erkunden, erheblich eingeschränkt wird. Wie gezeigt, können die vom Modell generierten Materialeigenschaften die Materialien in der Bibliothek übertreffen. Da sich der Umfang des Ersatz- und Inversnetzwerks weiter ausdehnt, mehr Materialien hinzugefügt und mehr Simulationen durchgeführt werden, gehen wir davon aus, dass das Inversnetzwerk nicht nur bestehende Materialien zunehmend übertreffen wird, sondern auch zur Identifizierung „effektiver“ Brechungsindizes und zur Information verwendet werden könnte das Reverse Engineering passender Materialkombinationen. Diese Stärken gehen bei einer starren Materialklassifizierung verloren. Um einen robusten Löser aufrechtzuerhalten, haben wir das Netzwerk so konzipiert, dass es Materialausgaben unterstützt, die nur durch die willkürliche Liste der Materialien begrenzt sind, die zur Generierung der Trainingsdaten verwendet werden.
Die Designentscheidung, die es dem Netzwerk ermöglicht, diskrete Materialeigenschaften auszuwählen – im Gegensatz zur Klassifizierung – führt zu erheblichen Herausforderungen und erfordert Designkompromisse. Frühe Iterationen des inversen Netzwerkdesigns nutzten ein einzelnes DNN mit einer einzelnen Vektoreingabe (400 × 1), wir stellten jedoch fest, dass die Ausgabe oft nicht-physikalisch oder unrealistisch war. Um das Modell auf der reinen Abstraktion der Materialeigenschaften zu gründen, haben wir daher eine sequentielle Methode unter Verwendung eines RNN implementiert, um sicherzustellen, dass das Modell die Vorwärts- und Rückwärtsbeziehungen der Materialeigenschaften lernen kann. Dies ermöglicht es dem Modell, ein gewisses Maß an physikalischen Erkenntnissen darüber zu gewinnen, wie Materialien normalerweise aussehen, sodass die Ausgabe bei der Generierung der Ausgabe der Leistung der Mikrostruktur aus dem „besten“ Material in der Bibliothek ähneln, diese aber hoffentlich übertreffen sollte . Darüber hinaus wurde beim frühen Aufbau unseres Netzwerks nur der Emissionsgrad als Eingabewert berücksichtigt. Bei nachfolgenden Modelliterationen stellten wir jedoch fest, dass die Einbeziehung der beiden Parameter, die den Emissionsgrad bestimmen – Reflexionsgrad und Transmission – nicht nur mehr Kontrolle für den Benutzer ermöglichten, sondern auch die Fähigkeit des Modells, physikalische Beziehungen zwischen den Materialien zu abstrahieren, zusätzlich stärkten Eigenschaften und Eingangsspektrum.
Ein wichtiger Gesichtspunkt ist der Einfluss der Geometrie auf die optischen Eigenschaften und damit auf die thermische Leistung im Vergleich zu einer untexturierten Oberfläche. Die durch den neuronalen Netzwerkprozess erzeugten und identifizierten Materialien entsprechen der physischen Intuition für jede der Testeingaben. Während diese Intuition für einen Materialanpassungsalgorithmus ausreichend sein kann, steigert die Anwendung einer optimierten Textur die Absorption weiter und verbessert das thermische und optische Ergebnis eines Systems. Dies gilt insbesondere für den in Abb. 3a dargestellten idealen Wärmeeintrag, bei dem eine optimale Texturierung zu einer Oberfläche führt, die über 96 % der einfallenden Sonnenstrahlung absorbieren kann, verglichen mit etwa 15 %, wenn die Oberfläche nicht strukturiert ist. Während untexturierter (völlig glatter) Graphit mit einer Dicke von < 100 µm eine Emissionseffizienz von ~ 33,5 % aufweist, erhöht ML durch optimale Texturierung die Emissionseffizienz auf ~ 99,6 %. Die Textur hat einen geringeren Einfluss auf Si3N4 und erhöht die Emissionseffizienz von ~ 75,6–99,9 %. Die Herleitung und grafische Darstellung dieser Werte ist in den Begleitmaterialien dargestellt.
Aus dem gewählten Netzwerkdesign ergeben sich mehrere zentrale Probleme. Die erste besteht darin, etwaige Fehler des inversen neuronalen Netzwerks zu identifizieren und anschließend zu korrigieren. Aufgrund des offenen Designs der materiellen Ausgänge und der großen Variabilität der Eingänge ist es für einen Benutzer sehr einfach, einen nicht-physikalischen Eingang anzugeben, der dazu führen kann, dass das Netzwerk für einen Großteil des Breitbandspektrums eine gültige Näherung vornimmt Es fehlt ein wichtiger schmaler Teil des Spektrums. Dies wird besonders deutlich im in Abb. 4 gezeigten Schmalbandfall, bei dem ein großer breitbandiger Wellenlängeneingang in Verbindung mit einem physikalisch nicht intuitiven Spektrum für ein Einzelmaterial-Mikrosystem verwendet wird. Diese Designherausforderung erforderte den Wechsel von nur breitbandigen Wellenlängeneingaben (0,3–16 µm) in den Trainingsdaten zur Randomisierung des Wellenlängen-/Materialvektors, der an den Ersatz übergeben wurde. Dennoch zeigen die Ergebnisse immer noch, dass das Modell versuchen wird, das Problem zu lösen, die Eingaben eines Benutzers jedoch natürlich nicht korrigieren kann. Es sollte anerkannt werden, dass das Netzwerk mithilfe physikalisch begrenzter und sequenzieller Ergebnisse trainiert wird. Daher ist nicht zu erwarten, dass die Abstraktion einer Lösung für ein möglicherweise nicht-physikalisches gewünschtes Spektrum ein hohes Maß an Genauigkeit aufweist. Eine zweite damit verbundene Herausforderung ergibt sich aus den Materialdatenpfaden und -generierungsmethoden. Die FDTD-Methode basiert auf Kurvenanpassungsdaten, die auf experimentell erfassten Messungen basieren. Unser Netzwerk erstellt ein Kubik-Spline-Anpassungsmodell basierend auf FDTD-generierten Materialdaten. Wenn wir die vom neuronalen Netzwerk erzeugten Materialeigenschaften simulieren möchten, müssen wir sie auf die gleiche Weise an FDTD übergeben, wie es bei physikalischen Messungen der Fall wäre. Dies kann zu einigen grundlegenden Herausforderungen bei der Kurvenanpassung und Automatisierung führen, da die FDTD-Kurvenanpassung für ML-generierte Daten möglicherweise völlig falsch ist und manuelle Eingriffe erfordert. Dieser Prozess schränkt auch unsere Möglichkeiten ein, ML-generierte Daten in der aggregierten Systemtrainingsschleife zu verwenden. Sollten die tatsächlichen Eigenschaften von den Eingaben abweichen, könnte die Einbeziehung der Daten zu erheblichen Prognoseungenauigkeiten führen. Für zukünftige Modellierungsbemühungen mit fortschrittlicheren Systemen und Verbundwerkstoffen aus mehreren Materialien wird eine sehr sorgfältige Interpretation und Interpolation der Materialeigenschaften erforderlich sein, um neue Materialien richtig darzustellen und vorherzusagen.
Eine weitere Herausforderung besteht darin, die Ausgabe basierend auf vom Benutzer festgelegten Grenzwerten einzuschränken. Es gibt zahlreiche potenziell anwendbare Einschränkungen, aber für diese Arbeit haben wir uns auf die Einschränkung des Seitenverhältnisses konzentriert, da es ein entscheidendes Element bei der Bestimmung der Herstellbarkeit und Skalierbarkeit einer Mikrostruktur ist. Mit der Einführung eines Nachbearbeitungsmoduls haben wir eine Lösung für beide Kernprobleme präsentiert. Dieses Modul ist kein neuronales Netzwerk, und es arbeitet außerhalb der „Black Box“ des neuronalen Netzwerkdesigns und kann mithilfe der optimalen Ausgabe des inversen Netzwerks einfacher an reale Szenarien angepasst werden. Ein offensichtlicher Mangel beim Entwurf neuronaler Netze besteht darin, die ständig zunehmende Komplexität der nichtlinearen Abstraktion zu verstehen, die innerhalb der „Blackbox“ der verborgenen Schichten auftritt. Wir könnten zwar Einschränkungen im Netzwerk einführen, neue Variablen hinzufügen usw., um den Einschränkungen Rechnung zu tragen, dies verringert jedoch möglicherweise nicht nur die Robustheit der Architektur, sondern könnte es auch schwierig machen, die Lösung durch physikalische Erkenntnisse zu ergänzen oder anzupassen.
Tatsächlich übernimmt das Nachbearbeitungsmodul sowohl die Rolle eines kontradiktorischen Prüfpunkts als auch einer lokalen Minimum-Optimierungsmethode. Wenn die auferlegten Einschränkungen verletzt werden, leitet das Nachverarbeitungsmodul neue Lösungen ab und bestimmt, welche davon am optimalsten sind. Natürlich könnte diese Methode auf die gleiche „Brute-Force“-Weise verwendet werden, die wir in früheren Veröffentlichungen20,32,72 verwendet haben, um eine lokale minimale optimale Lösung aus dem Ersatz zu bestimmen, insbesondere wenn sie mit einer Gradientenabstiegsoptimierungsmethode kombiniert wird . Dies bringt jedoch die gleichen Probleme mit sich wie die vorherigen Ansätze, da das Ergebnis wahrscheinlich nicht nur ein lokales Minimum ist, sondern dass wir den Vorgang auch für jedes Material in der Bibliothek wiederholen müssten. Das aggregierte System ist darauf ausgelegt, alle Module zu nutzen, um die Netzwerke automatisch zu lernen und zu korrigieren, wenn entweder das Ersatznetzwerk oder das inverse Netzwerk eine falsche Vorhersage macht. Durch die Generierung neuer Lösungen, deren Simulation und den anschließenden Vergleich der Simulationsergebnisse mit den Ersatzergebnissen und gewünschten Eingaben kann automatisch eine Entscheidung getroffen werden, die Simulationsdaten in eine nachfolgende Schleife der Datengenerierung und des Modelltrainings einzubeziehen. Dieser Prozess ist direkt auf jedes Mikrosystemdesign und auf fortgeschrittenere Iterationen übertragbar, die zusätzliche begrenzende Parameter wie Temperaturabhängigkeit und temperaturabhängige Materialeigenschaften umfassen. Die Unbegrenztheit des gesamten Kreislaufs eröffnet auch einzigartige Perspektiven und Lösungen, die sonst nicht realisierbar wären.
Wir haben eine Plattform demonstriert, die diskrete und einzigartige Material- und geometrische Eigenschaften ausgeben kann, die zu einem optischen Eingabespektrum führen. Die Modelle sind nicht streng durch die Materialklassifizierung eingeschränkt und das Netzwerk kann verwendet werden, um die Materialeigenschaften zu identifizieren, die das Problem am besten lösen würden. Der inverse Solver ermöglicht die Entwicklung eines Materialanpassungsalgorithmus, der basierend auf vom Benutzer festgelegten Einschränkungen identifizieren kann, welche Materialien am besten geeignet sind, um eine gewünschte optische Reaktion zu erzielen. Darüber hinaus ist der inverse Netzwerkeingang nicht auf einen voreingestellten Eingangswellenlängenvektor beschränkt, was zusätzlich zur traditionelleren breitbandigen inversen Optimierung die dynamische Erforschung von Schmalband- und begrenzten Wellenlängenlösungen ermöglicht. Als Teil der Plattform nimmt die vorgestellte Nachbearbeitungsmethode die Ausgabe des inversen neuronalen Netzwerks, entfernt sie aus der Black Box der neuronalen Netzwerkverarbeitung und ermöglicht Anpassungen der neuronalen Netzwerkausgabe basierend auf festgelegten Einschränkungen. Der Nachverarbeitungsabschnitt dient auch als Gegenknoten zum kombinierten System, stellt eine Verbindung zur FDTD-Simulationsquelle her und führt gezielte Simulationsdaten ein, um das neuronale Netzwerk in nachfolgenden Generationen zu verbessern. Während wir als Teil dieses Prozesses nur den von tiefen neuronalen Netzwerken abgeleiteten Ersatzlöser verwenden, könnte die von uns entwickelte bildbasierte Methode eine entscheidende Rolle in zukünftigen Iterationen inverser Designnetzwerke für kompliziertere Mikrostrukturen oder Multimaterialsysteme spielen, die dies nicht können einfach in einem tiefen neuronalen Netzwerk dargestellt. Unsere Methodik ersetzt nicht nur effektiv FDTD-Simulationen für Mikropyramiden, sondern ermöglicht auch nahezu sofortige inverse Konstruktion und Optimierung, was nahezu sofortige komplexe und umfassende Entwurfsoptimierungen ermöglicht.
Die während der aktuellen Studie generierten und/oder analysierten Datensätze und Modelle sind im Inverse-Optical-Neural-Network-Repository verfügbar, https://github.com/jmsulliv/Optical_Prediction_Reverse_Network.
Wir führen FDTD-Simulationen in der kommerziell erhältlichen FDTD-Simulationssoftware von Lumerical/ANSYS durch. Die in Abb. 1 dargestellte Elementarzelle repliziert die simulierten Hauptvariablen – xspan, zspan und tsub. Eine ebene Wellenquelle mit normalem Einfall wird in z-Richtung platziert. Für diese Arbeit berücksichtigen wir weder die Winkelabhängigkeit der optischen Eigenschaften noch die Abhängigkeit der optischen Eigenschaften vom Polarisationswinkel. Die Injektionswellenlänge umfasst einen linear beabstandeten Vektor von 100 Wellenlängenpunkten, der bei λmin beginnt und bei λmax endet. In Richtung der Injektionsquelle werden perfekt aufeinander abgestimmte Schichten aufgetragen, um Grenzreflexionen sowohl an der Ober- als auch an der Unterseite der Domäne zu verhindern. Außerdem werden periodische Randbedingungen senkrecht zur Wellenquelle festgelegt. Über und unter den PML-Grenzschichten werden Feld- und Leistungsmonitore im Frequenzbereich platziert, um die Reflexion bzw. Transmission zu überwachen. Der Emissionsgrad wird mithilfe des Kirchhoffschen Gesetzes berechnet, α = ε = 1 – R – T. Die Monitore werden an jedem Frequenz-/Wellenlängenpunkt berechnet, was zu einer Eins-zu-eins-Anpassung des Simulationsausgangs an die Wellenquelle führt.
Bei den Ersatztrainingsdaten gibt es zwar einige Variationen bei den Wellenlängen, die zur Generierung der Materialdaten verwendet werden72, die meisten Materialien werden jedoch mit einem λmin/λmax von jeweils 0,3/16 μm simuliert. Vanadiumdioxid wird in zwei separate Materialien unterteilt: eine Isolationsphase (keramisches Verhalten) und eine metallische Phase (metallisches Verhalten)78. Der Wert von tsub hängt von der Materialauswahl ab. Für Metalle (Ni, Al, Ag, W, Sn, Fe, Ta, Cr, Ti) und SiC simulieren wir über einen Bereich zufälliger tsub-Werte, der durch einen Mindestwert von 1 μm und einen Höchstwert von 3 μm begrenzt ist. Für durchlässige Materialien mit einem breiten Spektrum an substratabhängigen Leistungen (z. B. VO2, SiO2, PDMS, Al2O3) wählen wir eine minimale Dicke von 1 µm und eine maximale Dicke von 100 µm. Bei Simulationen, die als Teil der Nachverarbeitungsphase in der Gesamtnetzwerkschleife stattfinden, berücksichtigen Simulationen direkt die Ausgabeeigenschaften des Nachverarbeitungsmoduls/neuronalen Netzwerks.
Wir verwenden ein tiefes neuronales Netzwerk mit vollständig verbundenen dichten Schichten. Unser Deep-Learning-Ansatz basiert auf der Open-Source-Keras-Bibliothek in Python79. Das Ersatznetzwerk verwendet, wie bereits veröffentlicht72, ein optimiertes DNN mit 8 vollständig verbundenen dichten Schichten mit 400 Neuronen pro Schicht, und beide MLPs bestehen aus 4 Schichten mit jeweils 50 Neuronen.
Das CDNN-Netzwerk kombiniert eine ähnliche DNN-Struktur mit einer CNN-Architektur. Die erste DNN-Struktur nimmt denselben Eingabevektor auf wie das zuvor besprochene Netzwerk, verwendet jedoch einen kleineren Satz von Schichten und Neuronen. Das CNN verwendet 6 Faltungsgruppen – ReLU – maximales Pooling. Die Filterkonfiguration für die Faltungsschichten ist 64, 128, 256, 512, 512, 512. Auf die letzte Faltungsschicht folgt ein maximales Pooling, Dropout (0,25), Flatten, Dense, Dropout (0,5) und dann eine endgültige Dichte Schicht. Die Ausgabe wird mit der DNN-Struktur verkettet und in ein anderes DNN eingespeist, das aus 7 vollständig verbundenen dichten Schichten mit jeweils 1024 Neuronen besteht. Wir verwenden einen benutzerdefinierten Bildgeneratorprozess, um den Import von Bildern und den damit verbundenen Eigenschaften eines tiefen neuronalen Netzwerks in das Modell zu verwalten.
Das inverse Netzwerk nimmt denselben Satz von Eingaben (1 × 400-Vektor) und wendet ihn auf zwei verschiedene Arten an. Die erste ist eine direkte Eingabe in ein tiefes neuronales Netzwerk mit einer 1 × 400-Eingabeform, das aus 6 vollständig verbundenen dichten Schichten mit jeweils 750 Neuronen besteht. Die zweite Eingabe wandelt den ursprünglichen 1 × 400-Vektor in einen 1 × 100 × 4-Vektor um und wird in ein rekurrentes neuronales Netzwerk eingefügt. Das RNN besteht aus drei bidirektionalen LSTM-Modulen, d. h. einer bidirektionalen LSTM-Schicht, gefolgt von einem Dropout (0,5). Jede bidirektionale LSTM-Schicht verfügt über 320 Neuronen und die Ausgabe der letzten Schicht ist nicht sequenziert. Die Ausgaben von RNN und DNN werden verkettet und dann in ein größeres tiefes neuronales Netzwerk eingespeist, das aus 6 Schichten mit jeweils 1000 Neuronen besteht. Die endgültige Ausgabe beträgt 403 Neuronen ohne angewendete Aktivierungsfunktion. Wir experimentierten mit verschiedenen Methoden zum Kombinieren der beiden Ausgaben – einschließlich Matrixmultiplikation, Addition und Subtraktion –, stellten jedoch fest, dass die Verkettung durchweg die besten Ergebnisse lieferte.
Zum Training aller Modelle verwenden wir eine MSE-Verlustfunktion und validieren/bewerten sie mithilfe eines MAE-Scores basierend auf den Gleichungen. (1) bzw. (2), wobei \(Y_{i}\) der vorhergesagte Wert ist. Eine wesentliche Änderung des Modelltrainings im Vergleich zu früheren Ergebnissen besteht darin, dass alle Daten dem Netzwerk zur Verfügung gestellt werden und es im Trainingsprozess keine „unsichtbaren“ Materialien gibt. Für den Gittergenerierungsprozess verwenden wir zwar mehrere Materialien, die außerhalb des Umfangs des Trainingsprozesses liegen, für diese Materialien wurden jedoch vor dem Training des umgekehrten Netzwerks keine Simulationsdaten generiert. Die vollständige Liste der Materialien, die in der Schulung und in der Rastererstellung enthalten sind, finden Sie im
In allen Fällen erfolgt die Optimierung der Hyperparameter mit der integrierten Hyperband-Optimierungsmethode80. Adam ist in allen Fällen die Optimierungs-Engine, die für das Netzwerktraining verwendet wird. Um eine Überanpassung zu minimieren, nutzen wir die L2-Regularisierung im Trainings- und Validierungsprozess. Darüber hinaus nutzen wir frühes Stoppen, Checkpoint-Save und reduzieren die Lernrate bei Plateau-Callbacks mit niedrigen Geduldswerten72. Einige Modelle enthalten Dropout-Schichten, um die Überanpassung des Modells weiter zu reduzieren.
Alle von den neuronalen Netzen verwendeten Datensätze werden direkt von den Eingaben und Ausgaben der FDTD-Simulation abgeleitet. Für jedes Material im Trainings-/Validierungs-/Testdatensatz der Ersatzmodelle generieren wir eine gleichmäßig verteilte Zufallsmatrix für jede der geometrischen Eigenschaften, die als Eingaben für die Simulation verwendet wird. Die Simulationswellenlänge sowie die n- und k-Werte werden aus jeder Simulation übernommen und in Eingabedatensätze aufgeteilt, die insgesamt 8 neuronale Eingaben umfassen (n und k werden in εreal und εim umgewandelt). Die Simulationsausgabe besteht aus 100 Emissions- und 100 Reflexionspunkten, die eins zu eins mit dem Simulationswellenlängenvektor übereinstimmen, der für jedes λ in Paare unterteilt ist. Der εreale Permittivitätswert ist aufgrund der negativen Werte, die durch den Term -k2 in Gleichung (1) hervorgerufen werden, von besonderer Bedeutung. (4).
Ein grundlegendes Problem besteht darin, dass der Unterschied zwischen k = 1e-4 und 1e-3 optisch gesehen zwar nicht groß ist, der Unterschied jedoch einen großen Einfluss auf das Übertragungsverhalten durch das Substrat hat. Daher werden die Daten in der Nähe von 0 gruppiert, aber wir müssen die Werte auf sinnvolle Weise differenzieren, um das physikalische Verhalten jedes Materials zu unterscheiden. Die Protokollnormalisierung verringert den Schweregrad der gewichteten Eingaben, löst ihn jedoch nicht. Für alle in dieser Arbeit gezeigten Datensätze verwenden wir die Quantilnormalisierung mit dem integrierten Quantiltransformator von sklearn, um eine gleichmäßige Verteilung der Eingaben für k, tsub, εreal und εim zu erzeugen. Eine Änderung gegenüber unseren vorherigen Ergebnissen72 besteht darin, dass wir die Normalisierungspipeline vereinfachen, indem wir den Brechungsindex n und die geometrischen Eigenschaften mithilfe der Quantilmethode normalisieren. Alle in dieser Arbeit verwendeten Datensätze sowie die zum Normalisieren, Denormalisieren und Konfigurieren der Daten verwendeten Techniken werden in unserem GitHub-Repository bereitgestellt.
Für die Ersatzmodelle kombinieren wir 40.500 FDTD-Simulationen für Mikropyramiden aus 41 verschiedenen Materialien, um unseren Trainings-, Validierungs- und Testdatensatz zu bilden. Wir verfolgen jeweils eine Aufteilung von 70/20/10 Prozent. Der Testdatensatz wird zur Bewertung der Leistung und Überanpassung des Modells verwendet und wird vom Netzwerk im Trainingsprozess nicht gesehen. Wir mischen den gesamten Datensatz jedes Mal, wenn das Modell ausgeführt oder generiert wird, sodass die Trainings-, Validierungs- und Testdatensätze niemals von Iteration zu Iteration identisch sind.
Beim inversen Modell werden die Trainingsdaten mithilfe der Ersatzdaten generiert. Während das Surrogat das Reflexionsvermögen und das Transmissionsvermögen für eine Ausgabe für einen einzelnen Wellenlängenpunkt bereitstellt, verwendet die Umkehrung eine vollständige Vektoreingabe durch Stapeln von Vorhersagen aus dem Surrogat. Die Vektoreingabe mit voller Wellenlänge, die einer Ausgabe entspricht, bezeichnen wir als „Ersatzsimulation“. Für jedes Material entwickeln wir ein Raster aus Ersatzsimulationen, indem wir xspan und zspan der Mikropyramide variieren und einen zufälligen Wellenlängenvektor und Dickenwert für jeden einzelnen Satz von (xspan, zspan) im Raster hinzufügen. Das Gitter wird mithilfe eines Randomisierungsprozesses für Paare von geometrischen X- und Z-Koordinaten generiert. Der Prozess prüft, ob jedes Material keine sich wiederholenden Paare aufweist. Der Randomisierungsprozess für den Wellenlängenvektor umfasst die Erstellung eines linear beabstandeten Vektors aus 100 Punkten mit einem randomisierten Minimal- und Maximalwert. Die minimalen und maximalen Werte sind die zufällig generierten Parameter und liegen zwischen (0,3–15) bzw. (2–16) μm. Wenn der zufällig ausgewählte „Minimalwert“ größer als der „Maximum“-Wert ist, werden die Werte bei der Generierung des Wellenlängenvektors vertauscht. Der Zufallsprozess wird wiederholt, um sicherzustellen, dass die Lücke zwischen dem minimalen und dem maximalen Wellenlängenwert 2 µm beträgt. Die Materialinformationen werden durch Eingabe des generierten Wellenlängenvektors in eine Spline-Kurvenanpassung generiert. Die Spline-Kurvenanpassungen werden mithilfe eines 2000-Punkte-Datensatzes für jedes Material generiert. Aufgrund der Größe des inversen Datensatzes verwenden wir für den Trainingsprozess des inversen Netzwerks eine Aufteilung von 50/40/10 Training/Validierung/Test.
Die Ausgabe des inversen neuronalen Netzwerks enthält einen Vektor aus n- und k-Werten, der an eine Eingabe von Wellenlängenpunkten angepasst ist. Um das „beste“ Material bereitzustellen, vergleichen wir die Materialdaten (n, k) mit den Materialdaten in der Bibliothek. Die Bibliotheksdaten werden mit dem gleichen Spline-Prozess wie im vorherigen Abschnitt beschrieben generiert und hängen vom Benutzerwellenlängenspektrum ab, das in das umgekehrte Netzwerk eingegeben wurde. Wir prüfen jede (n, k)-Vektorkombination in der Materialbibliothek anhand der Modellausgabe mithilfe der in Gleichung gezeigten Methode der kleinsten Quadrate. (5).
Vor dem Vergleich der Werte mit Gl. (5) passen wir den (n,k)-Vektor mithilfe einer in Gleichung gezeigten Log-Transformation an. (6). Während ein Vergleich mit Gl. (5) immer noch realisierbar ist, ermöglicht die Log-Anpassung bessere Vergleiche mit Materialien, die stark von winzigen Unterschieden in den n- und k-Werten abhängen. Wie bereits erwähnt, hängen durchlässige Materialien stark von kleinen Änderungen der n- und k-Werte ab. Wenn wir also über eine Skala verfügen, die einen besseren Vergleich für kleine Werte ermöglicht, können wir bessere Schlussfolgerungen aus Gleichung (1) ziehen. 6, welche Materialien am besten zur ML-Ausgabe passen.
Im Nachbearbeitungsmodul passen wir die inverse Netzwerkausgabe entsprechend den vom Benutzer festgelegten Einschränkungen an. In unserer vorliegenden Arbeit begrenzen wir nur das Seitenverhältnis, aber die Methode kann leicht angepasst werden, um mehr Bedingungen zu berücksichtigen. Dazu generieren wir zwei Sätze neuer geometrischer Koordinaten (für dasselbe Material), die die Einschränkung nicht verletzen. Der Prozess beginnt mit der Anpassung der X- und Z-Koordinate der ursprünglichen Lösung, während gleichzeitig die andere Koordinate fixiert wird, bis das Seitenverhältnis innerhalb der Einschränkungen liegt. Dies folgt unserer zuvor etablierten Intuition über die Rolle des Seitenverhältnisses bei der Bestimmung der Optimalität optischer/thermischer Eigenschaften20. Für eine andere Mikrostruktur müssten wir diesen Prozess anpassen, um ihn an die beobachteten Muster für die Mikrotextur und die gewünschte Einschränkung anzupassen. Aus diesen beiden neuen Punkten generieren wir neue geometrische Paare innerhalb eines Radius um die geänderte geometrische Koordinate. Der Generierungsprozess ist zufällig und einheitlich, und Lösungen, die nicht kleiner oder gleich dem gewünschten Seitenverhältnis sind, werden eliminiert. Alle brauchbaren Lösungen werden dann an den Ersatz für Vorhersagen übergeben; Die Ergebnisse, die am besten zur gewünschten Eingabe passen, werden in FDTD simuliert. Wir wählen auch zufällige Punkte aus dem verbleibenden Pool zufällig generierter realisierbarer geometrischer Lösungen aus, um zusätzliche Lösungsvielfalt zu bieten und Bedenken hinsichtlich einer übermäßigen Vorspannung des Netzwerks zu verringern, wenn der Ersatz die neuen FDTD-Lösungen in das Training einbezieht. Die gewünschten Eingaben und Modell-/FDTD-Ausgaben werden unter Verwendung von Gleichung (1) auf Optimalität ausgewertet. (5). Dieser Prozess wird verwendet, um Lösungen separat für die direkte ML-Materialausgabe und dann die „am besten geeigneten“ Materialien zu generieren. Oft verwenden wir nur ein einzelnes „Best-Fit“-Material, aber in manchen Fällen schauen wir über die erste Bibliotheksübereinstimmung hinaus.
Raman, AP, Anoma, MA, Zhu, L., Rephaeli, E. & Fan, S. Passive Strahlungskühlung unter Umgebungslufttemperatur bei direkter Sonneneinstrahlung. Natur 515, 540–544. https://doi.org/10.1038/nature13883 (2014).
Artikel ADS CAS PubMed Google Scholar
Nie, X. et al. Kaltweiße Polymerbeschichtungen auf Basis von Glasblasen für Gebäude. Wissenschaft. Rep. 10, 1–10. https://doi.org/10.1038/s41598-020-63027-2 (2020).
Artikel ADS CAS Google Scholar
Zhai, Y. et al. Skalierbar hergestelltes, randomisiertes Glas-Polymer-Hybrid-Metamaterial für die Strahlungskühlung am Tag. Wissenschaft 355, 1062–1066. https://doi.org/10.1126/science.aai7899 (2017).
Artikel ADS CAS PubMed Google Scholar
Yin, X., Yang, R., Tan, G. & Fan, S. Terrestrische Strahlungskühlung: Nutzung des kalten Universums als erneuerbare und nachhaltige Energiequelle. Wissenschaft 370, 786–791. https://doi.org/10.1126/science.abb0971 (2020).
Artikel ADS CAS PubMed Google Scholar
Li, P. et al. Großflächige nanophotonische solarselektive Absorber für die hocheffiziente solarthermische Energieumwandlung. Adv. Mater. 27, 4585–4591. https://doi.org/10.1002/adma.201501686 (2015).
Artikel CAS PubMed Google Scholar
Kumar, R. & Rosen, MA Wärmeleistung eines Solarwarmwasserbereiters mit integriertem Kollektorspeicher und gewellter Absorberoberfläche. Appl. Therm. Ing. 30, 1764–1768. https://doi.org/10.1016/j.applthermaleng.2010.04.007 (2010).
Artikel Google Scholar
Pfiester, NA & Vandervelde, TE Selektive Emitter für thermophotovoltaische Anwendungen. Physik. Status Solidi Appl. Mater. Wissenschaft. 214, 1–24. https://doi.org/10.1002/pssa.201600410 (2017).
Artikel CAS Google Scholar
Li, W. & Fan, S. Nanophotonische Kontrolle der Wärmestrahlung für Energieanwendungen [Eingeladen]. Opt. Express 26, 15995. https://doi.org/10.1364/oe.26.015995 (2018).
Artikel ADS CAS PubMed Google Scholar
Mandal, J. et al. Hierarchisch poröse Polymerbeschichtungen für hocheffiziente passive Strahlungskühlung am Tag. Wissenschaft 362, 315–319. https://doi.org/10.1126/science.aat9513 (2018).
Artikel ADS CAS PubMed Google Scholar
Dang, S., Wang, X. & Ye, H. Eine ultradünne transparente photonische Strahlungskühlungsstruktur mit hoher NIR-Reflexion. Adv. Mater. Schnittstellen 2201050, 1–10. https://doi.org/10.1002/admi.202201050 (2022).
Artikel CAS Google Scholar
Yu, Z., Nie, J. Appl. Physik. https://doi.org/10.1063/5.0015650 (2020).
Artikel Google Scholar
Nie, X., Yu, Z., Jackson, E. & Lee, J. Brechungsindex und Extinktionskoeffizient von Hohlmikrokugeln für die Sonnenreflexion. Appl. Physik. Lette. https://doi.org/10.1063/5.0049018 (2021).
Artikel Google Scholar
Sala-Casanovas, M., Krishna, A., Yu, Z. & Lee, J. Bioinspirierte dehnbare selektive Emitter auf Basis von Wellnickel für das persönliche Wärmemanagement. Nanoskalige Mikroskalen-Thermophys. Ing. 23, 173–187. https://doi.org/10.1080/15567265.2019.1586017 (2019).
Artikel ADS CAS Google Scholar
Krishna, A. et al. Steuerung des Emissionsvermögens im ultravioletten bis mittleren Infrarotbereich durch mechanisch rekonfigurierbares Graphen. Nano Lett. 19, 5086–5092. https://doi.org/10.1021/acs.nanolett.9b01358 (2019).
Artikel ADS CAS PubMed Google Scholar
Zhu, J., Hsu, CM, Yu, Z., Fan, S. & Cui, Y. Nanodome-Solarzellen mit effizientem Lichtmanagement und Selbstreinigung. Nano Lett. 10, 1979–1984. https://doi.org/10.1021/nl9034237 (2010).
Artikel ADS CAS PubMed Google Scholar
Lee, BJ, Chen, YB, Han, S., Chiu, FC & Lee, HJ Wellenlängenselektiver solarthermischer Absorber mit zweidimensionalen Nickelgittern. J. Wärmeübertragung 136, 1–7. https://doi.org/10.1115/1.4026954 (2014).
Artikel CAS Google Scholar
Zhou, L., Yu, X. & Zhu, J. Nanokegel mit Metallkern/Halbleiterschale zur breitbandigen Verbesserung der Sonnenabsorption. Nano Lett. 14, 1093–1098. https://doi.org/10.1021/nl500008y (2014).
Artikel ADS CAS PubMed Google Scholar
Lung, CM, Wang, WC, Chen, CH, Chen, LY & Chen, MJ ZnO/Al2O3-Kern/Schale-Nanostäbe ordnen sich als hervorragende Antireflexionsschichten auf Siliziumsolarzellen an. Mater. Chem. Physik. 180, 195–202. https://doi.org/10.1016/j.matchemphys.2016.05.063 (2016).
Artikel CAS Google Scholar
Søndergaard, T. et al. Plasmonisches schwarzes Gold durch adiabatische Nanofokussierung und Absorption von Licht in ultrascharfen konvexen Rillen. Nat. Komm. 3, 1–6. https://doi.org/10.1038/ncomms1976 (2012).
Artikel CAS Google Scholar
Sullivan, J., Yu, Z. & Lee, J. Optische Analyse und Optimierung der Mikropyramidentextur zur Kontrolle der Wärmestrahlung. Nanoskalige Mikroskalen-Thermophys. Ing. https://doi.org/10.1080/15567265.2021.195896010(1080/15567265),pp.1958960,2021 (2021).
Artikel Google Scholar
Campbell, P. & Green, MA Lichteinfangeigenschaften von pyramidenförmig strukturierten Oberflächen. J. Appl. Physik. 62, 243–249. https://doi.org/10.1063/1.339189 (1987).
Artikel ADS Google Scholar
Leon, JJD, Hiszpanski, AM, Bond, TC & Kuntz, JD Entwurfsregeln zum Anpassen der Antireflexionseigenschaften hierarchischer optischer Strukturen. Adv. Opt. Mater. 5, 1–8. https://doi.org/10.1002/adom.201700080 (2017).
Artikel CAS Google Scholar
Zhang, T. et al. Schwarzes Silikon mit selbstreinigender Oberfläche, hergestellt durch Benetzungsverfahren. Nanoskalige Res. Lette. 8, 1–5. https://doi.org/10.1186/1556-276X-8-351 (2013).
Artikel ADS CAS Google Scholar
Liu, Y. et al. Hierarchische, robuste Strukturstrukturen für selbstreinigende Solarzellen aus schwarzem Silizium im großen Maßstab. Nanoenergie 3, 127–133. https://doi.org/10.1016/j.nanoen.2013.11.002 (2014).
Artikel CAS Google Scholar
Dimitrov, DZ & Du, CH Kristalline Siliziumsolarzellen mit Mikro-/Nanotextur. Appl. Surfen. Wissenschaft. 266, 1–4. https://doi.org/10.1016/j.apsusc.2012.10.081 (2013).
Artikel ADS CAS Google Scholar
Nishijima, Y. et al. Antireflexionsoberflächen: Kaskadierende Nano-/Mikrostrukturierung. APL Photon. https://doi.org/10.1063/1.4964851 (2016).
Artikel Google Scholar
Mavrokefalos, A., Han, SE, Yerci, S., Branham, MS & Chen, G. Effizientes Lichteinfangen in dünnen kristallinen Siliziummembranen mit umgekehrter Nanopyramide für Solarzellenanwendungen. Nano Lett. 12, 2792–2796. https://doi.org/10.1021/nl2045777 (2012).
Artikel ADS CAS PubMed Google Scholar
Wang, H. & Wang, L. Perfekte selektive Metamaterial-Solarabsorber. Opt. Express 21, A1078. https://doi.org/10.1364/oe.21.0a1078 (2013).
Artikel ADS PubMed Google Scholar
Sai, H., Yugami, H., Kanamori, Y. & Hane, K. Solarselektive Absorber basierend auf zweidimensionalen W-Oberflächengittern mit Submikronperioden für die photothermische Hochtemperaturumwandlung. Sol. Energie Mater. Sol. Zellen 79, 35–49. https://doi.org/10.1016/S0927-0248(02)00364-1 (2003).
Artikel CAS Google Scholar
Qi, Z. et al. Mit Au-Nanopartikeln dekorierte Siliziumpyramiden für die plasmonenverstärkte Photodetektion heißer Elektronen im Nahinfrarotbereich. Nanotechnologie https://doi.org/10.1088/1361-6528/aa74a3 (2017).
Artikel PubMed Google Scholar
Zhai, Y., Li, Y., Ji, J., Wu, Z. & Wang, Q. Erzeugung heißer Elektronen in Silizium-Mikropyramiden, bedeckt mit nanometerdicken Goldfilmen für Nahinfrarot-Fotodetektoren. ACS-Appl. Nano Mater. 3, 149–155. https://doi.org/10.1021/acsanm.9b01840 (2020).
Artikel CAS Google Scholar
Sullivan, J., Yu, Z. & Lee, J. Nanometerdicke Nickelbeschichtungen auf Silizium-Mikropyramiden für die Infrarotabsorption. ACS-Appl. Nano Mater. 5, 4615–4622. https://doi.org/10.1021/acsanm.2c00541 (2022).
Artikel CAS Google Scholar
Deinega, A., Valuev, I., Potapkin, B. & Lozovik, Y. Minimierung der Lichtreflexion von dielektrischen strukturierten Oberflächen. J. Opt. Soc. Bin. A 28, 770. https://doi.org/10.1364/josaa.28.000770 (2011).
Artikel ADS Google Scholar
Zhang, H. et al. Biologisch inspirierte flexible photonische Filme für effiziente passive Strahlungskühlung. Proz. Natl. Acad. Wissenschaft. 117, 202001802. https://doi.org/10.1073/pnas.2001802117 (2020).
Artikel CAS Google Scholar
Shore, KA Numerische Methoden in der Photonik, von Andrei V. Lavrinenko, Jesper Laegsgaard, Niles Gregersen, Frank Schmidt und Thomas Sondergaard. Zeitgenössische Physik Bd. 57 (2016). https://doi.org/10.1080/00107514.2015.1133707.
Malkiel, I. et al. Design und Charakterisierung plasmonischer Nanostrukturen mittels Deep Learning. Lichtwissenschaft. Appl. https://doi.org/10.1038/s41377-018-0060-7 (2018).
Artikel PubMed PubMed Central Google Scholar
Bojarski, M. et al. End-to-End-Lernen für selbstfahrende Autos. 1–9 (2016).
Sainath, TN, Vinyals, O., Senior, A. & Sak, H. Faltung, langes Kurzzeitgedächtnis, vollständig verbundene tiefe neuronale Netze. ICASSP, IEEE Int. Konf. Akustisch. Sprachsignalprozess. - Proz. 2015-August, 4580–4584 (2015). https://doi.org/10.1109/ICASSP.2015.7178838.
Bock, K. & Garnsey, SM Sprachverarbeitung. in A Companion to Cognitive Science vol. 349 226–234 (Blackwell Publishing Ltd, 2017). https://doi.org/10.1002/9781405164535.ch14.
Sajedian, I., Kim, J. & Rho, J. Ermittlung der optischen Eigenschaften plasmonischer Strukturen durch Bildverarbeitung unter Verwendung einer Kombination aus Faltungs-Neuronalen Netzen und wiederkehrenden Neuronalen Netzen. Mikrosystem. Nanoeng. https://doi.org/10.1038/s41378-019-0069-y (2019).
Artikel PubMed PubMed Central Google Scholar
Seo, J. et al. Entwurf eines Breitband-Solarthermieabsorbers unter Verwendung eines tiefen neuronalen Netzwerks und experimentelle Demonstration seiner Leistung. Wissenschaft. Rep. 9, 1–9. https://doi.org/10.1038/s41598-019-51407-2 (2019).
Artikel ADS CAS Google Scholar
Wu, D. et al. Das Design eines ultrabreitbandigen, selektiven, nahezu perfekten Absorbers basierend auf photonischen Strukturen, um eine nahezu ideale Strahlungskühlung am Tag zu erreichen. Mater. Des. 139, 104–111. https://doi.org/10.1016/j.matdes.2017.10.077 (2018).
Artikel Google Scholar
Han, S., Shin, JH, Jung, PH, Lee, H. & Lee, BJ Breitbandiger solarthermischer Absorber auf Basis optischer Metamaterialien für Hochtemperaturanwendungen. Adv. Opt. Mater. 4, 1265–1273. https://doi.org/10.1002/adom.201600236 (2016).
Artikel CAS Google Scholar
Elzouka, M., Yang, C., Albert, A., Prasher, RS & Lubner, SD Interpretierbares vorwärts- und inverses Design des spektralen Emissionsvermögens von Partikeln unter Verwendung gängiger Modelle für maschinelles Lernen. Cell Rep. Phys. Wissenschaft. 1, 100259. https://doi.org/10.1016/j.xcrp.2020.100259 (2020).
Artikel Google Scholar
Peurifoy, J. et al. Nanophotonische Partikelsimulation und inverses Design mithilfe künstlicher neuronaler Netze. arXiv 1–8 (2017). https://doi.org/10.1117/12.2289195https://doi.org/10.1117/12.2289195.
Balin, I., Garmider, V., Long, Y. & Abdulhalim, I. Training eines künstlichen neuronalen Netzwerks zur Optimierung der Leistung nanostrukturierter VO 2 -basierter intelligenter Fenster. Opt. Express 27, A1030. https://doi.org/10.1364/oe.27.0a1030 (2019).
Artikel ADS CAS PubMed Google Scholar
Wu, S. et al. Durch maschinelles Lernen unterstützte Entdeckung von Polymeren mit hoher Wärmeleitfähigkeit mithilfe eines molekularen Designalgorithmus. Npj-Berechnung. Mater. https://doi.org/10.1038/s41524-019-0203-2 (2019).
Artikel Google Scholar
Suh, Y., Bostanabad, R. & Won, Y. Deep Learning sagt die Siedewärmeübertragung voraus. Wissenschaft. Rep. 11, 1–10. https://doi.org/10.1038/s41598-021-85150-4 (2021).
Artikel ADS CAS Google Scholar
Kudyshev, ZA, Kildishev, AV, Shalaev, VM & Boltasseva, A. Durch maschinelles Lernen unterstütztes Metaoberflächendesign für die Optimierung hocheffizienter thermischer Emitter. Appl. Physik. Rev. https://doi.org/10.1063/1.5134792 (2020).
Artikel Google Scholar
Kang, HH, Kaya, M. & Hajimirza, S. Ein datengesteuertes künstliches neuronales Netzwerkmodell zur Vorhersage der Strahlungseigenschaften von metallischen Festbetten. J. Quant. Spektroskopie Strahlen. Transf. 226, 66–72. https://doi.org/10.1016/j.jqsrt.2019.01.013 (2019).
Artikel ADS CAS Google Scholar
Tausendschön, J. & Radl, S. Auf einem tiefen neuronalen Netzwerk basierende Wärmestrahlungsmodellierung zwischen Partikeln sowie zwischen Wänden und Partikeln. Int. J. Wärme-Massentransf. https://doi.org/10.1016/j.ijheatmasstransfer.2021.121557 (2021).
Artikel Google Scholar
Wiecha, PR, Arbouet, A., Girard, C. & Muskens, OL Deep Learning in der Nanophotonik: Inverses Design und darüber hinaus. arXiv 9, 182–200 (2020). https://doi.org/10.1364/prj.415960.
Lee, D., Jiang, S., Balogun, O. & Chen, W. Dynamische Kontrolle der plasmonischen Lokalisierung durch inverse Optimierung der räumlichen Phasenmodulation. ACS Photon. 9, 351–359. https://doi.org/10.1021/acsphotonics.1c01043 (2022).
Artikel CAS Google Scholar
He, J., He, C., Zheng, C., Wang, Q. & Ye, J. Plasmonische Nanopartikelsimulationen und inverses Design mit maschinellem Lernen. Nanoskala 11, 17444–17459. https://doi.org/10.1039/c9nr03450a (2019).
Artikel CAS PubMed Google Scholar
Gao, L., Li, X., Liu, D., Wang, L. & Yu, Z. Ein bidirektionales tiefes neuronales Netzwerk für präzises Silizium-Farbdesign. Adv. Mater. 31, 1–7. https://doi.org/10.1002/adma.201905467 (2019).
Artikel ADS CAS Google Scholar
Ma, W., Cheng, F., Xu, Y., Wen, Q. & Liu, Y. Probabilistische Darstellung und inverses Design von Metamaterialien basierend auf einem tiefen generativen Modell mit halbüberwachter Lernstrategie. Adv. Mater. 31, 1–9. https://doi.org/10.1002/adma.201901111 (2019).
Artikel CAS Google Scholar
Molesky, S. et al. Inverses Design in der Nanophotonik. Nat. Photon. 12, 659–670. https://doi.org/10.1038/s41566-018-0246-9 (2018).
Artikel ADS CAS Google Scholar
Kudyshev, ZA, Kildishev, AV, Shalaev, VM & Boltasseva, A. Durch maschinelles Lernen unterstützte globale Optimierung photonischer Geräte. Vorderseite. Opt. Photonik 10, 381–393. https://doi.org/10.1515/9783110710687-028 (2021).
Artikel Google Scholar
Kalt, V. et al. Metamodellierung von Gittern mit hohem Kontrastindex für die Farbwiedergabe. J. Opt. Soc. Bin. A 36, 79. https://doi.org/10.1364/josaa.36.000079 (2019).
Artikel ADS Google Scholar
Ma, W., Cheng, F. & Liu, Y. Deep-Learning-gestütztes On-Demand-Design chiraler Metamaterialien. ACS Nano 12, 6326–6334. https://doi.org/10.1021/acsnano.8b03569 (2018).
Artikel CAS PubMed Google Scholar
Liu, D., Tan, Y., Khoram, E. & Yu, Z. Training tiefer neuronaler Netze für das inverse Design nanophotonischer Strukturen. ACS Photon. 5, 1365–1369. https://doi.org/10.1021/acsphotonics.7b01377 (2018).
Artikel CAS Google Scholar
Also, S. & Rho, J. Entwerfen nanophotonischer Strukturen unter Verwendung bedingter tiefer konvolutioneller generativer gegnerischer Netzwerke. Nanophotonik 8, 1255–1261. https://doi.org/10.1515/nanoph-2019-0117 (2019).
Artikel Google Scholar
Liu, Z., Zhu, D., Rodrigues, SP, Lee, KT & Cai, W. Generatives Modell für das inverse Design von Metaoberflächen. Nano Lett. 18, 6570–6576. https://doi.org/10.1021/acs.nanolett.8b03171 (2018).
Artikel ADS CAS PubMed Google Scholar
Shi, X., Qiu, T., Wang, J., Zhao, X. & Qu, S. Inverses Design von Metaoberflächen mit maschinellen Lernansätzen. J. Phys. D. Appl. Physik. https://doi.org/10.1088/1361-6463/ab8036 (2020).
Artikel Google Scholar
Deng, L., Xu, Y. & Liu, Y. Hybrider inverser Entwurf photonischer Strukturen durch Kombination von Optimierungsmethoden mit neuronalen Netzen. Photon. Nanostruktur. Fundam. Appl. 52, 101073. https://doi.org/10.1016/j.photonics.2022.101073 (2022).
Artikel Google Scholar
Jiang, X. et al. Implementierung einer Strahlungskühlung mit einem invers gestalteten selektiven Emitter. Opt. Komm. 497, 127209. https://doi.org/10.1016/j.optcom.2021.127209 (2021).
Artikel CAS Google Scholar
Dong, R., Dan, Y., Li, X. & Hu, J. Inverses Design von optischen Metalloxid-Verbundmaterialien basierend auf Deep Transfer Learning und globaler Optimierung. Berechnen. Mater. Wissenschaft. 188, 110166. https://doi.org/10.1016/j.commatsci.2020.110166 (2021).
Artikel CAS Google Scholar
Jiang, X. et al. Abstimmbarer selektiver Mittelinfrarot-Emitter basierend auf einer Metaoberfläche mit umgekehrtem Design für Infrarot-Stealth mit Wärmemanagement. Opt. Express 30, 18250. https://doi.org/10.1364/oe.456791 (2022).
Artikel ADS CAS PubMed Google Scholar
Jiang, X. et al. Metaoberfläche basierend auf inversem Design zur Maximierung der spektralen Sonnenabsorption. Adv. Opt. Mater. 9, 1–11. https://doi.org/10.1002/adom.202100575 (2021).
Artikel CAS Google Scholar
Macleod, HA Optische Dünnschichtfilter. Dünnschicht-Opt. Filter https://doi.org/10.1887/075030688210.1887/0750306882 (1986).
Artikel ADS Google Scholar
Wei, WR et al. Organisch-anorganische Hybridsolarzellen mit einem Wirkungsgrad von über 11 % und omnidirektionalen Ernteeigenschaften durch den Einsatz hierarchischer Photoneneinfangstrukturen. Nano Lett. 13, 3658–3663. https://doi.org/10.1021/nl401540h (2013).
Artikel ADS CAS PubMed Google Scholar
Sullivan, J., Mirhashemi, A. & Lee, J. Deep-Learning-basierte Analyse mikrostrukturierter Materialien zur Kontrolle der Wärmestrahlung. Wissenschaft. Rep. 12, 1–14. https://doi.org/10.1038/s41598-022-13832-8 (2022).
Artikel CAS Google Scholar
An, S. et al. Ein Deep-Learning-Ansatz für das objektive, vollständig dielektrische Metaoberflächendesign. ACS Photon. 6, 3196–3207. https://doi.org/10.1021/acsphotonics.9b00966 (2019).
Artikel CAS Google Scholar
Chan, DLC, Soljačić, M. & Joannopoulos, JD Wärmeemission und Design in eindimensionalen periodischen metallischen photonischen Kristallplatten. Physik. Rev. Stat. Nichtlineare Physik der weichen Materie. 74, 206–214. https://doi.org/10.1103/PhysRevE.74.016609 (2006).
Artikel CAS Google Scholar
Krishna, A. & Lee, J. Morphologiegesteuerter Emissionsgrad mikroskaliger baumartiger Strukturen für das Strahlungswärmemanagement. Nanoskalige Mikroskalen-Thermophys. Ing. 22, 124–136. https://doi.org/10.1080/15567265.2018.1446065 (2018).
Artikel ADS CAS Google Scholar
Yee, K. Numerische Lösung anfänglicher Randwertprobleme mit Maxwell-Gleichungen in isotropen Medien. IEEE Trans. Antennenpropag. 14, 302–307. https://doi.org/10.1109/TAP.1966.1138693 (1966).
Artikel ADS MATH Google Scholar
Lee, D. et al. Auf einem wiederkehrenden neuronalen Netzwerk basierendes akustisches Modell mit langem Kurzzeitgedächtnis unter Verwendung einer konnektionistischen zeitlichen Klassifizierung auf einem umfangreichen Trainingskorpus. China Komm. 14, 23–31. https://doi.org/10.1109/CC.2017.8068761 (2017).
Artikel Google Scholar
Wan, C. et al. Über die optischen Eigenschaften von Dünnfilm-Vanadiumdioxid vom sichtbaren bis zum fernen Infrarot. Ann. Physik. 1900188, 1900188. https://doi.org/10.1002/andp.201900188 (2019).
Artikel CAS Google Scholar
Chollet, F. Keras. https://github.com/fchollet/keras (2015).
Li, L., Jamieson, K., DeSalvo, G., Rostamizadeh, A. & Talwalkar, A. Hyperband: Ein neuartiger banditenbasierter Ansatz zur Hyperparameteroptimierung. J. Mach. Lernen. Res. 18, 1–52 (2018).
MathSciNet MATH Google Scholar
Referenzen herunterladen
Die Finanzierung erfolgte durch die NASA (Grant Nos. 80NSSC19K1671, 80NSSC19K1671).
Fakultät für Maschinenbau und Luft- und Raumfahrttechnik, University of California, Irvine, CA, USA
Jonathan Sullivan und Jaeho Lee
NASA Glenn Research Center, Cleveland, OH, USA
Arman Mirhashemi
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
Sie können diesen Autor auch in PubMed Google Scholar suchen
JS, AM und JL hatten die Idee. JS trug zur Generierung der Deep-Learning-Modelle, Optimierung und Datensatzvorbereitung bei. JS hat zu den FDTD-Simulationen beigetragen. JS trug zur Generierung und Implementierung des Materialsuchalgorithmus, des Tandem-Neuronalen Netzwerks und der aggregierten Netzwerkarchitektur bei. Alle Autoren diskutierten die Ergebnisse und überarbeiteten das Manuskript.
Korrespondenz mit Jaeho Lee.
Die Autoren geben an, dass keine Interessenkonflikte bestehen.
Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.
Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.
Nachdrucke und Genehmigungen
Sullivan, J., Mirhashemi, A. & Lee, J. Deep-Learning-basiertes inverses Design mikrostrukturierter Materialien zur optischen Optimierung und Wärmestrahlungskontrolle. Sci Rep 13, 7382 (2023). https://doi.org/10.1038/s41598-023-34332-3
Zitat herunterladen
Eingegangen: 07. Dezember 2022
Angenommen: 27. April 2023
Veröffentlicht: 06. Mai 2023
DOI: https://doi.org/10.1038/s41598-023-34332-3
Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:
Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.
Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt
Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.