Ein Forscherteam diskutiert vor einem Bildschirm mit neuronalen Netzwerkdiagrammen

Warum NVIDIA einer KI erst erklären muss, dass Eis schmilzt: Das steckt hinter Cosmos Reason

Was für den Menschen selbstverständlich ist – wie etwa, dass Eis bei Zimmertemperatur schmilzt oder Vögel nicht rückwärts fliegen – stellt Künstliche Intelligenz oft vor ungeahnte Herausforderungen. NVIDIA arbeitet daher daran, seinen KI-Modellen durch gezieltes Training das beizubringen, was uns Menschen so natürlich erscheint: gesunder Menschenverstand.

Menschliche Unterstützung für bessere KI-Reasoning

  • KI-Modelle entwickeln sich rasant, benötigen aber Unterstützung beim Verständnis von Alltagswissen.
  • Common Sense – etwa dass Eis schmilzt oder Spiegel reflektieren – ist für Menschen selbstverständlich, aber schwer für KI erfassbar.
  • Damit künstliche Intelligenz effektiv schlussfolgern kann, müssen ihr diese alltagslogischen Zusammenhänge explizit beigebracht werden.
  • NVIDIA verfolgt neue Ansätze, bei denen Menschen eine zentrale Rolle im Trainingsprozess der KI einnehmen.
  • Ziel ist es, KI-Systeme mit besserem Reasoning auszustatten, um zuverlässigere, nachvollziehbarere Entscheidungen zu ermöglichen.

Warum gesunder Menschenverstand in der KI-Entwicklung entscheidend ist

Anders als Menschen sammeln KI-Modelle ihr Wissen nicht durch ein Leben voller Erfahrungen. Sie lernen aus Daten – möglichst vielen, möglichst diversen. Doch das allein reicht nicht, um „gesunden Menschenverstand“ zu entwickeln. Hier setzt NVIDIA Cosmos Reason an – ein KI-Modell, das durch ein neuartiges Testverfahren lernt, physikalische Abläufe und Umweltzusammenhänge richtig einzuordnen. Ziel ist die Entwicklung von sogenannter physical AI, also KI-Systemen, die in einer realen Umgebung logisch handeln können, z. B. in der Robotik oder im autonomen Fahren.

Ein gutes Beispiel liefert ein Video aus dem Testdatensatz von Cosmos Reason: Darin fahren zwei Autos auf einer Straße. Die KI muss einschätzen, was passiert, wenn beide auf derselben Spur aufeinander zufahren. Die „Antwort“ mag für uns banal erscheinen – ein Unfall – für eine untrainierte KI ist das jedoch alles andere als offensichtlich.

NVIDIA setzt hierbei auf eine Vielzahl realitätsgetreuer Tests, ähnlich wie Prüfungsfragen für Schüler. Diese sogenannten „Reasoning Tests“ decken eine breite Palette physikalischer Situationen ab. Fragen wie „Welches Objekt fällt schneller?“ oder „Warum reflektiert ein Spiegel?“ helfen dem Modell, mit Zeit, Raum und logischen Abfolgen umzugehen. Weitere Details dazu finden sich auch in der Pressemitteilung von NVIDIA.

Reinforcement Learning als Trainingsgrundlage für KI-Logik

Damit eine KI Modelle der Welt erschließen kann, kommt Reinforcement Learning (Bestärkendes Lernen) zum Einsatz. So wie ein Kind lernt, dass eine heiße Herdplatte weh tut, lernt Cosmos Reason durch Versuch und Irrtum – allerdings geführt über strukturierte Bewertungsmechanismen und eine robuste Datengrundlage.

Entscheidend ist, dass das Modell erkennt, wie sich physikalische Objekte verhalten. Ein Roboter etwa muss verstehen, dass seine Bewegungen Konsequenzen haben können – eine missverständliche Geste könnte einen Zusammenstoß verursachen oder Menschen gefährden. NVIDIA betont daher, wie essenziell physikalisches Weltverständnis für die Sicherheit ist: Ein Roboter ohne physikalischen Sinn kann gefährlich sein, egal wie fortschrittlich seine Sensorik ist.

Ein interdisziplinäres Team bei NVIDIA – von Bioingenieuren über Wirtschaftsexperten bis hin zu Sprachwissenschaftlern – kuratiert dafür umfangreiche Datensätze. Diese bestehen aus echten Videoszenen, zu denen Multiple-Choice-Fragen und korrekte Antworten erstellt werden. Diese „KI-Prüfungen“ dienen der ständigen Verbesserung der Modelle und werden anschließend mit Hilfe von Verstärkungslernen eingesetzt.

Datenfabrik: Wie NVIDIA Modelle durch echte Videos schlauer macht

Die sogenannte Data Factory von NVIDIA ist das Rückgrat der KI-Trainingsarbeit. In komplexen Prozessen erstellt ein Team von Annotatoren tausende Videosequenzen, analysiert sie und versieht sie mit passenden Aufgabenstellungen.

Ein Beispiel: In einer Szene wird gezeigt, wie eine Person Nudeln mit der linken Hand schneidet. Die annotierte Frage dazu ist: „Mit welcher Hand wird die Spaghetti geschnitten?“ Die KI muss die richtige Antwort aus vier Optionen auswählen. Anschließend überprüfen Analystinnen wie Michelle Li (Public Health & Datenanalyse) die Qualität dieser Fragesätze und bewerten, ob sie den Trainingszielen genügen.

Das Ziel: Modelle sollen lernen, Szenen realitätsgetreu zu interpretieren, physikalische Gesetzmäßigkeiten anzuwenden und logische Schlussfolgerungen zu treffen. Erst wenn Cosmos Reason rund 100.000 solcher Aufgaben korrekt meistert, werden die Erkenntnisse in größere Einsatzbereiche übertragen – etwa für autonome Systeme oder fortgeschrittene Robotik.

NVIDIA hebt zudem hervor, dass Modelle wie Cosmos Reason künftig im Bereich autonome Systeme oder bei der sicheren Robotik in Produktionsstätten eingesetzt werden könnten – mit enormen Auswirkungen auf Industrie, Logistik und Smart Cities.

Physical AI: Der nächste Schritt zur menschenähnlichen Intelligenz

Das Besondere an Cosmos Reason ist seine Fähigkeit zur logischen Herleitung in zeitlich zusammenhängenden Szenarien – eine Fähigkeit, die man im Englischen als „temporal reasoning“ bezeichnet. Das Modell kann beispielsweise priorisieren, erklären und Ergebnisse voraussagen. Es erkennt nicht nur, dass zwei Autos frontal kollidieren würden, sondern gibt auch eine Erklärung dafür ab. Diese „transparente Logik“ ist ein großer Schritt in Richtung menschenähnlicher KI.

Hier liegt eine Stärke, die weit über klassische Sprachmodelle hinausgeht: Während ChatGPT und ähnliche Tools auf der Basis von Textvorhersage funktionieren, beinhaltet Physical AI Modelle mit echter Umweltkompetenz – ein kritischer Vorteil für reale Anwendungsfelder.

Auf Hugging Face lässt sich das Modell herunterladen, und auf GitHub finden Interessierte weiterführende technische Details. Wer sich ein Bild vom Modell in Aktion machen möchte, kann auch die Projektpage von NVIDIA besuchen.

Fazit: Cosmos Reason bringt Künstliche Intelligenz einen riesigen Schritt näher an das, was bislang dem Menschen vorbehalten war – die Fähigkeit, im Chaos des Alltags klar zu handeln. Und damit könnte dieses Modell die KI-Landschaft revolutionieren.

Häufig gestellte Fragen zu Cosmos Reason und physikalischer KI

Quelle: https://blogs.nvidia.com/blog/ai-reasoning-cosmos/

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Nach oben scrollen
Logitech Zone 300: Revolutionäres kabelloses Headset für Home Office Entdecke Destiny 2: „Echos“ – Start, Inhalte und Belohnungen Wie man Steam-Spiele effektiv deinstalliert und Speicherplatz freigibt Entdecke die Hama Outdoor-Kamera: Sicherheit und Komfort Erlebe die Thrustmaster Airshow 2: Virtuelle Kunstflug-Show mit Gewinnspiel