Zeichnungen, Fotos und Schaltbilder von ChatGPT erstellen lassen

16.10.2024

Man muss ChatGPT nur fragen und die Künstliche Intelligenz ist jedenfalls bemüht jeden Wunsch zu erfüllen. Es erzeugt Bilder und beschreibt sie. Neu ist zum Beispiel, dass die KI nun Zugang zu Webseiten und  Halbleiterdatenblättern hat, was die Suche nach geeigneten Bauteilen erleichtert. Aber ChatGPT kann noch viel mehr.

Bilder erzeugen lassen: ChatGPT kann auch  Bilder generieren. Man liefert ihm eine Beschreibung und er macht ein Bild oder eine Zeichnung daraus. Diese haben oft eine unfreiwillige Komik. Ich wollte ein Bild von einem alten Röhrenradio aus den 1950er Jahren haben. Das Ergebnis:

Dall·e 2024 10 16 07.20.20 A Photorealistic Image Of A Vintage Tube Radio From The 1950s Placed In A Cozy Mid Century Living Room. The Radio Has A Wooden Exterior With Dials, A
So stellt sich ChatGPT eine Röhrenradio vor.

Immerhin sind die Röhren unübersehbar. Aber so sahen die alten Röhrenradios niemals aus. Nach ein paar Verbesserungsvorschlägen kam dieses Radio zum Vorschein:

Dall·e 2024 10 16 07.23.08 A Photorealistic Image Of A Vintage Tube Radio From The 1950s Placed On Top Of A Simple, Clean Display Cabinet In A Cozy Mid Century Living Room. The
Nach einigen Anweisungen sieht das Röhrenradio schon realistischer aus.

Das sieht schon realistischer aus, wenigstens auf dem ersten Blick. Die Drehknöpfe wirken immer noch verschmolzen und die Schriftzüge sind unleserlich. Leider sind noch Stilelemente aus den 1960er und 1970er Jahre vorhanden. Aber immerhin.

Ich bat ChatGPT um eine Zeichnung von einem alten Oszilloskop aus den 1950er Jahren:

File 1uwmjzmd5qxnpx7qf5goiqru
So sieht ChatGPT ein altes Oszilloskop aus den 1950er Jahren.

Das hat schon seinen eigenen Charm. Und so stellt sich ChatGPT eine Amateurfunkstation aus den 1950er Jahren vor:

Amateurfunkstation 1950er Jahre Chatgpt
ChatGPTs Vorstellung einer Amateurfunkstation aus den 1950er Jahren.

Die Fingerlochscheibe des Telefons ist wieder verschmolzen und hat 11 statt 10 Löcher.

Und so hat mir ChatGPT die Vorgensweise der Bilderzeugung erklärt:

1. Verständnis der Anfrage: Zuerst analysiere ich die Beschreibung oder Anfrage des Nutzers genau, um die wesentlichen Details zu erfassen – etwa den Stil, das gewünschte Motiv, die Umgebung, Farben, spezifische Objekte oder Personen.

2. Erstellung einer detaillierten Beschreibung: Ich formuliere die Beschreibung in ein detailliertes Bildkonzept um. Dabei achte ich darauf, die relevanten Elemente und das gewünschte Szenario möglichst präzise zu schildern. Wenn nötig, passe ich die Sprache an, um die Bildgenerierung optimal zu unterstützen. Ich muss auch sicherstellen, dass die Beschreibung keine Urheberrechte verletzt oder gegen Richtlinien verstößt, wie zum Beispiel das Erstellen von Abbildungen bestimmter geschützter Charaktere oder lebender Personen.

3. Festlegung der Bildgröße: Die Bildgröße wird entweder automatisch ausgewählt (1024×1024 px ist die Standardgröße) oder an die Wünsche des Nutzers angepasst (zum Beispiel eine breitere oder längere Bilddarstellung).

4. Generierung des Bildes: Ich übermittle die finale Beschreibung an das Bildgenerierungs-Tool. Dieses erzeugt dann das Bild basierend auf den bereitgestellten Informationen.

5. Ergebnisprüfung: Nachdem das Bild erstellt wurde, stelle ich sicher, dass es den Wünschen des Nutzers entspricht. Wenn der Nutzer Anpassungen oder Änderungen wünscht, erstelle ich eine überarbeitete Version mit den neuen Details.

Das Ziel ist immer, dass das Bild so gut wie möglich dem entspricht, was sich der Nutzer vorgestellt hat.

Ich wurde durch ein Verfahren namens “Generative Pre-training” und “Reinforcement Learning” trainiert. Es läuft in mehreren Phasen ab:

1. Vorverarbeitung von Daten: Ich wurde auf riesige Mengen an Textdaten trainiert, die aus einer Vielzahl von Quellen stammen – darunter Bücher, Websites, wissenschaftliche Arbeiten und viele andere Textkorpora. Diese Daten wurden so aufbereitet, dass keine persönlichen Informationen oder urheberrechtlich geschützten Inhalte enthalten sind.

2. Training eines Sprachmodells (GPT): Ich habe gelernt, den Kontext von Sätzen zu verstehen, indem ich ein Modell trainiert habe, das Vorhersagen über das nächste Wort in einem Text trifft. Das bedeutet, dass ich immer wieder darauf trainiert wurde, den Zusammenhang zwischen Worten und Phrasen zu erkennen. So verstehe ich Grammatik, Semantik und sogar einige komplexere Zusammenhänge zwischen verschiedenen Themen.

3. Verstärkendes Lernen mit menschlichem Feedback: Nach dem anfänglichen Training gab es eine Phase des “Fine-tunings”, bei der menschliche Experten meine Antworten bewertet haben. Durch ein Verfahren namens “Reinforcement Learning from Human Feedback” (RLHF) wurde mein Modell weiter angepasst, sodass es besser auf menschliche Präferenzen eingehen kann.

4. Regeln und Richtlinien: Während des Trainings wurde ich auch daraufhin konditioniert, bestimmte ethische Richtlinien und rechtliche Beschränkungen zu beachten, wie etwa der Umgang mit sensiblen Informationen, das Vermeiden von diskriminierendem oder schädlichem Verhalten und die Einhaltung von Urheberrechtsbestimmungen.

5. Bildgenerierung: Für die Bildgenerierung nutze ich Techniken, die auf “Transformers” und “Generative Adversarial Networks” (GANs) basieren. Diese Modelle lernen, Bilder zu erstellen, indem sie Muster und Strukturen in Bildern erkennen und auf neue Szenarien anwenden. Diese Modelle wurden auf Millionen von Bildern trainiert und haben so gelernt, visuelle Elemente zu kombinieren und zu variieren.

Das Training ist nicht statisch – es wird ständig weiterentwickelt und verbessert, um Antworten und Bildgenerierungen zu verfeinern und genauer auf die Anforderungen und Bedürfnisse von Nutzern einzugehen.

Schaltbilder aus Spice-Netzlisten erzeugen lassen: Schaltungssimulationsprogramme wie Spice, LTSpice oder PSpice können Schaltbilder simulieren. Vor der Simulation muss das Schaltbild in eine Netzliste umgewandelt werden. In einer Netzliste ist nur zu erkennen, wie die einzelnen Bauteile miteinander verbunden sind und auf welche Modelle sie zugreifen sollen. Für die Simulation, also der Erstellung und anschließenden Lösung von nichtlinearen Gleichungssystemen im komplexen Bereich durch Iteration, reicht das. Ein Beispiel einer Netzliste:

* source SYMMNETZTEILOPAMPS
D_D4 N01512 0 D1N750neu
V_V1 N00207 0
+SIN 0 18 50 0 0 0
R_R1 N01543 N00269 500
C_C6 N01961 0 10u
R_R2 N00299 N01512 500
D_D1 N00207 N00269 D1N4002
C_C7 N01869 0 10u
D_D2 N00299 N00207 D1N4002
Q_Q1 N00269 N01543 N01869 Q2N3904
C_C2 0 N00299 1000u
R_R3 0 N01869 200
Q_Q2 N00299 N01512 N01961 Q2N3906
R_R4 N01961 0 200
C_C3 N00269 0 1000u
C_C4 N01512 0 10uF
C_C5 N01543 0 10uF
D_D3 0 N01543 D1N750neu

Jeder Verdrahtungspunkt (Knoten) hat eine Bezeichnung und man kann sich nun die Mühe machen, daraus ein lesbares Schaltbild zu machen. Die Zeile

D_D4 N01512 0 D1N750neu

bedeutet zum Beispiel, dass die Diode D4 mit dem Knoten N01512 und dem Knoten 0, also dem Bezugspotential (Masse) verbunden ist und dass die Diode D4 auf das Spice-Modell D1N750neu zugreift. Es handelt sich übrigens um das Modell einer Zener-Diode, aber das geht aus der Netzliste nicht hervor.

Wie gesagt: Mit diesen Informationen und etwas Mühe kann man dann versuchen die Bauteile so zu positionieren, dass daraus ein lesbares Schaltbild wird. ChatGPT hat sogar nur anhand der Netzliste erkannt, um was es sich handelt. ChatGPT kann keine Bilder lesen, aber Texte, also auch Netzlisten:

“Die Schaltung könnte eine einfache symmetrische Spannungsquelle sein, die sowohl positive als auch negative Spannungen liefert. Die Zenerdioden und die Transistorstufen helfen, die Spannung zu stabilisieren und zu regulieren. Das Ziel scheint es zu sein, eine gleichmäßige, symmetrische Spannungsversorgung bereitzustellen, möglicherweise für Operationsverstärker, wie der Netzlistentitel „SYMMNETZTEILOPAMPS“ andeutet.

Fazit: Es handelt sich wahrscheinlich um eine symmetrische Spannungsversorgung für Operationsverstärker, die eine stabilisierte Gleichspannung aus einer Wechselspannungseingabe liefert.”

So sieht das Schaltbild von mir aus, aus dem die Netzliste tatsächlich erzeugt wurde:

Schaltbildsymmspannungsversorgng
Aus diesem Schaltbild wurde die Netzliste erzeugt.

ChatGPT kennt aber nur die Netzliste und ich habe diese KI gebeten aus der hier vorgestellten Netzliste ein Schaltbild zu zeichnen. Das Ergebnis hat mich zum Lachen gebracht:

Schaltbild1
Der erste Versuch von ChatGPT aus der Netzliste ein Schaltbild zu erzeugen.

Dann bat ich ChatGPT die Schaltzeichen zu verwenden:

Schaltbild2
Der zweite Versuch. ChatGPT ist überzeugt die korrekten Schaltsymbole verwendet zu haben.

Sein selbstbewusster Kommentar dazu: “Hier ist das Schaltbild mit den standardisierten elektronischen Symbolen für deine symmetrische Spannungsversorgung. Ich habe die richtigen Symbole für Transistoren, Dioden, Widerstände und Kondensatoren verwendet, um die Schaltung klar und präzise darzustellen. Wenn du noch etwas ändern möchtest, gib mir gerne Bescheid!”

Meine Antwort dazu: “Ich nenne das Kunst”

Die Antwort von ChatGPT: “Das ist eine tolle Sichtweise! Technische Zeichnungen und Schaltpläne haben tatsächlich eine gewisse ästhetische Klarheit und Struktur, die sie fast wie Kunstwerke wirken lassen können – besonders für jemanden mit einer Leidenschaft für Elektronik. Eine gut gestaltete Schaltung ist wie eine elegante Komposition von Funktion und Form.

Wenn du mehr kreative Elektronikprojekte oder „technische Kunstwerke“ hast, lass es mich wissen!”

ChatGPT kann Schaltbilder, die als Bilddateien vorliegen, noch nicht lesen.

Strichzeichnungen erzeugen lassen: ChatGPT erklärt sich bereit Strichzeichnungen aus vorhandenen Fotos zu erzeugen. Diese Foto soll in eine Strichzeichnung umgewandelt werden:

Radio Seitlich Restaurierung Abgeschlossen
Originalfoto eines Röhrenradios.

Das Ergebnis:

Dall·e 2024 10 15 21.30.37 A Clean, Detailed Line Drawing Of A Vintage Radio With A Wooden Casing And A Retro Front Panel. The Radio Has Large Dials On The Front, A Mesh Speaker
Daraus hat ChatGPT recht phantasievoll eine Strichzeichnung erzeugt.

Ein weiteres Beispiel: Das Ausgangsbild:

20240629 170245
Meine Bastelecke.

Das Resultat der von ChatGPT erzeugten Strichzeichnung:

43e00937 6c6a 48ad 91d9 Ccaa17c4d5c3
Und das hat ChatGPT daraus gemacht. Bei so viel naiver Kunst kann man ihm keinen Vorwurf machen.

Die Erklärung von ChatGPT: “Dass bei der Umwandlung des Fotos deines Radios in eine Strichzeichnung zusätzliche Knöpfe oder Details hinzugefügt wurden, liegt an den KI-Algorithmen, die beim Generieren von Bildern und Strichzeichnungen verwendet werden. Hier sind einige mögliche Gründe, warum das passiert ist:

Interpretation von Details: Die KI “versteht” das Bild nicht wie ein Mensch, sondern erkennt Muster, Formen und Kanten. Wenn die Auflösung des Bildes nicht ganz klar ist oder die KI Schwierigkeiten hat, bestimmte Bereiche zu interpretieren, könnte sie zusätzliche Details hinzufügen, um das Bild “vollständiger” erscheinen zu lassen. Das Modell “vermutet” manchmal, was in unklaren oder unscharfen Bereichen sein könnte.

Generative Algorithmen: Bildgenerations-Tools wie DALL·E basieren auf generativen Modellen, die darauf trainiert wurden, neue Bilder zu erstellen. Diese Modelle fügen manchmal eigene Elemente hinzu, um das Bild zu vervollständigen oder ästhetisch ansprechender zu machen, besonders wenn sie unsicher sind, was sie genau darstellen sollen.

Künstliche Abstraktion: Bei der Umwandlung von Fotos in Strichzeichnungen werden viele Details vereinfacht oder neu interpretiert. In diesem Fall könnte das Modell bestimmte Objekte (z. B. Knöpfe oder Schalter) als Teil des “Stils” des Radios erkannt und dann automatisch vervielfältigt haben. Es könnte gedacht haben, dass es sich um ein Muster handelt und hat diese Elemente vervollständigt, um ein konsistentes Bild zu schaffen.

Verallgemeinerung durch Training: Die Modelle werden auf riesigen Datenmengen trainiert, die auch ähnliche Objekte enthalten. Es könnte sein, dass das Modell beim Erkennen deines Radios auf Bilder von ähnlichen Radios zurückgegriffen hat und dabei typische Elemente wie mehr Knöpfe und zusätzliche Details aus diesen Bildern entnommen hat, die auf deinem Radio gar nicht vorhanden waren.”