Auf dem AI Infra Summit 2025 sorgte SK hynix für Aufsehen mit einer Technologie, die den Flaschenhals moderner KI-Anwendungen zu durchbrechen verspricht: Accelerator-in-Memory (AiM). Was hinter diesem Durchbruch steckt – und warum es das Zeug hat, die Art und Weise, wie künstliche Intelligenz skaliert, grundlegend zu verändern – zeigen wir euch in diesem Beitrag.
- SK hynix präsentiert AiM1-Lösung auf dem AI Infra Summit 2025
- AiM-Technologie: Der Speicher denkt mit
- Disaggregierte Inferenz: Neue Wege für KI-Workloads
- Software trifft Hardware: vLLM bringt die KI zum Laufen
- Mehr als Marketing: Warum AiM das neue Rückgrat der KI werden könnte
- Fazit: Ein Gamechanger für die KI-Zukunft
- Häufige Fragen zur AiM-Technologie von SK hynix
SK hynix präsentiert AiM1-Lösung auf dem AI Infra Summit 2025
- SK hynix stellte seine verbesserte AiM1-basierte AI Memory-Lösung auf dem AI Infra Summit 2025 in Santa Clara vor.
- Die Technologie basiert auf dem Accelerator-in-Memory (AiM) Prinzip, einer Form des Processing-in-Memory (PIM).
- Das vorgestellte GDDR6-AiM kombiniert Speicher- und Verarbeitungsfunktionen zur Beschleunigung von AI-Workloads.
- Die Lösung zielt auf eine höhere Energieeffizienz und Leistungsfähigkeit bei zukünftigen AI-Services ab.
- Mit dem Messeauftritt unterstreicht SK hynix seine technologische Führungsrolle im Bereich AI-Infrastruktur.








AiM-Technologie: Der Speicher denkt mit
Während klassische Systeme Speicher und Rechenleistung strikt voneinander trennen, setzt SK hynix bei seiner Accelerator-in-Memory (AiM)-Lösung auf eine revolutionäre Idee: Der Speicher bekommt Rechenkraft. Genauer gesagt, basiert das Konzept auf dem Prinzip „Processing-in-Memory“ (PIM), bei dem Rechenoperationen direkt im Speicher erfolgen. Dadurch entfällt der energie- und zeitintensive Datentransfer zwischen CPU/GPU und RAM – ein Flaschenhals, der vor allem bei großen KI-Modellen (Large Language Models) zum echten Problem wird.
Die auf dem AI Infra Summit vorgestellte AiMX-Karte demonstrierte dieses Prinzip eindrucksvoll. Zusammen mit zwei NVIDIA H100 GPUs konnte ein dediziertes Supermicro-Serversystem komplexe Anfragen in deutlich kürzerer Zeit und bei niedrigerem Stromverbrauch abarbeiten – und zwar live vor Publikum. Diese Entwicklung ist für Anwendungen mit starkem Daten- und Rechenbedarf, wie Large Language Models (LLMs) à la ChatGPT oder Bard, wegweisend.
Das Konzept erinnert ein wenig an das menschliche Gehirn: Auch hier findet ein Großteil der „Rechenleistung“ lokal statt, ohne jeden Gedankengang ständig erst durch andere Regionen „zu transferieren“. Die Funktionseinheiten agieren vernetzt – genau wie im AiM-Ansatz.
Weitere Informationen zur Veranstaltung und zur Original-Pressemitteilung findet ihr direkt im SK hynix Newsroom.
Disaggregierte Inferenz: Neue Wege für KI-Workloads
Eine der spannendsten Anwendungen der AiM-Technologie ist die sogenannte disaggregierte Inferenzarchitektur. Diese trennt die Ausführung von rechenintensiven und speicherintensiven Phasen während eines KI-Modells auf zwei Spezialsysteme auf. Während GPUs sich auf komplexe Berechnungen konzentrieren (compute-bound), übernimmt die AiMX-Karte die speicherintensiven Lese-/Schreibprozesse (memory-bound) für Modelle wie GPT-4.
Diese Auslagerung – auch „Memory Wall Offloading“ genannt – schafft Kapazitäten für längere Prompts, parallele Anfragen und eine effizientere Ressourcennutzung. Besonders deutlich wird das, wenn man heutige Systeme mit nur GPU-Setup betrachtet: Dort konkurrieren Rechen- und Datentransferprozesse um dieselben Ressourcen, was zu Verzögerungen führen kann.
- GPU-only: Alles überlastet ein System → Ineffizienzen
- AiM-basiert: Aufgabenverteilung → Effizienzsteigerung
- Konsequenz: Mehr Nutzeranfragen parallel möglich
Dieses innovative Architekturmodell könnte die Antwort auf die Frage sein, wie KI-Systeme wirklich skalierbar werden – ohne dabei die Stromrechnung in die Höhe zu treiben oder Rechenzentren zu überlasten.
Software trifft Hardware: vLLM bringt die KI zum Laufen
Doch nicht nur die Hardware selbst wurde überarbeitet – auch die Softwareintegration der neuen AiMX-Karten zielt auf maximale Effizienz. Im Fokus steht dabei das Open-Source-Framework vLLM, das von vielen KI-Entwicklungsplattformen genutzt wird. Es optimiert das Token-Management und beschleunigt die Ausgabe generierter Texte – gerade bei komplexen Inferenzmodellen, die logisches oder vorausschauendes Denken simulieren.
Die Integration sorgt für:
- Stabile Inferenzprozesse auch bei langen Tokens
- Reduktion von Latenz durch „intelligentes“ Caching
- Kompatibilität mit aktuellen LLM-Entwicklungsumgebungen
Gerade in Szenarien wie Chatbots, Textevervollständigung oder maschinelles Übersetzen zahlt sich diese Synergie aus. Sie verbessert nicht nur das Nutzererlebnis, sondern reduziert dank effizienterer Speicher- und Berechnungsauslastung auch die Stromkosten erheblich – ein Pluspunkt sowohl wirtschaftlich als auch ökologisch.
Mehr als Marketing: Warum AiM das neue Rückgrat der KI werden könnte
Was SK hynix hier präsentiert hat, ist mehr als ein Technologie-Upgrade. Es ist ein zukunftsorientierter Paradigmenwechsel in der Entwicklung von KI-Infrastruktur. Besonders beeindruckend: Beim Vortrag von Vice President Euicheol Lim wurde deutlich, dass man nicht nur auf Performance, sondern gezielt auf Kostenreduktion abzielt. Thema: „Crushing the Token Cost Wall“ – also das Brechen der Token-Kostenmauer.
In vielen praktischen KI-szenarien machen die Tokenkosten (also Rechen- und Speicheraufwand pro Textbaustein) bis zu 50 % der Gesamtkosten aus – Tendenz steigend. Durch die Implementierung von Attention-Offloading-Mechanismen auf AiMX-basierten Systemen lassen sich diese Werte laut SK hynix um bis zu 30 % reduzieren.
Das ist nicht nur für Tech-Giganten relevant: Unternehmen aus der Medizintechnik, Finanzbranche oder Logistik, die bereits mit Künstlicher Intelligenz experimentieren, profitieren gleichermaßen. Denn durch sinkende Infrastrukturkosten wird ein wirtschaftlicher Einsatz zunehmend realistisch – bei gleichzeitig steigender Rechenleistung.
Fazit: Ein Gamechanger für die KI-Zukunft
Die AiM-Technologie von SK hynix ist mehr als nur ein Forschungsergebnis – sie ist ein marktfähiger Innovationsschritt, der schon bald breite Anwendung finden könnte. Die Kombination aus hoher Rechenleistung, geringem Energieverbrauch und verbesserter Skalierbarkeit positioniert AiMX als ernsthafte Alternative zu bisherigen GPU-exklusiven Lösungen in der KI-Infrastruktur.
Die reale Relevanz solcher Entwicklungen zeigt sich spätestens dann, wenn unser Alltag zunehmend von KI-Assistenzsystemen, Sprachmodellen und smarten Automatisierungsprozessen geprägt ist. Die Effizienz dieser Systeme entscheidet, wie schnell, intelligent und verantwortungsvoll wir mit dieser Technologie arbeiten können. Wie SK hynix eindrucksvoll zeigt, spielt der Speicher dabei künftig eine entscheidendere Rolle als je zuvor.
Mehr zur Veranstaltung und zu Videos der Demos findet ihr auch im offiziellen AI Infra Summit 2025 Rückblick.
https://www.youtube.com/watch?v=ssTb0R2dMk4
Häufige Fragen zur AiM-Technologie von SK hynix
Quelle: https://news.skhynix.com/ai-infra-summit-2025/





