MacMalschman: Die Periodentafel des maschinellen Lernens: Ein neues System zur Einordnung von KI-Algorithmen

Einleitung: Ein Team von Forschern am MIT – in Zusammenarbeit mit Microsoft und Google – hat einen neuartigen „Periodentafel“-Ansatz für Machine Learning (ML) entwickelt[1]. Ähnlich wie die chemische Periodentafel der Elemente soll dieses Periodensystem des maschinellen Lernens helfen, disparate Lernverfahren in einem gemeinsamen Rahmen zu systematisieren und sogar Lücken für noch unentdeckte Methoden aufzuzeigen[2][3]. Das zugrunde liegende Framework trägt den Namen Information Contrastive Learning (I-Con)[1]. I-Con vereinheitlicht über 20 klassische ML-Algorithmen – von Klassifikations- und Regressionsmethoden über Clusteranalyse bis hin zu dimensionaler Reduktion und selbst großen Sprachmodellen – unter einem einzigen mathematischen Dach[1]. Dieser Artikel erläutert die Struktur und Funktionsweise dieser „Periodentafel“, gibt aktuelle Anwendungsbeispiele für ihren Nutzen und vergleicht sie mit ähnlichen Ansätzen zur systematischen Einordnung von KI-Verfahren. Die Darstellung richtet sich sowohl an technisch-wissenschaftliche Leser als auch an allgemein technisch Interessierte – sie ist also erklärend, aber nicht oberflächlich.

1. Struktur und Funktionsweise der Periodentafel des ML

Im Kern basiert das I-Con-Framework auf einer einfachen, aber leistungsfähigen Idee: Maschinelles Lernen lässt sich als das Lernen von Beziehungen zwischen Datenpunkten auffassen[4]. Unterschiedliche Algorithmen konzentrieren sich dabei auf unterschiedliche Arten von Beziehungen – doch die grundlegende Mathematik ist stets ähnlich[4]. I-Con zeigt, dass viele populäre Verfahren nur Variationen eines gemeinsamen Prinzips sind: Ein ML-Algorithmus versucht, bestehende Zusammenhänge in den Daten durch ein vereinfachtes Modell abzubilden, und zwar so, dass die Abweichung zwischen den echten Beziehungen und den im Modell gelernten möglichst gering ist[5][6]. Diese Abweichung wird formell durch die Kullback-Leibler-Divergenz gemessen – ein Maß dafür, wie stark sich zwei Verteilungsmuster unterscheiden[6]. Vereinfacht gesagt minimiert jeder Algorithmus eine bestimmte Fehlerfunktion, welche genau diesen Unterschied zwischen „Daten-Wirklichkeit“ und „Modell-Vorstellung“ der Datenbeziehungen ausdrückt[7].

Kategorisierung nach Beziehungen und Annäherungsmethoden: Um die Vielfalt der ML-Algorithmen greifbar zu machen, haben die Forscher ein zweidimensionales Kategorienschema eingeführt[8]. Dimension 1 beschreibt die Art der realen Beziehung („Supervisory Signal“), die ein Algorithmus ausnutzt – z. B. Nähe im Merkmalsraum, Zugehörigkeit zur selben Klasse, gemeinsame Nachbarschaft in einem Graphen oder gepaarte Ähnlichkeit zwischen Datenpunkten[9][10]. Dimension 2 beschreibt die Art und Weise, wie der Algorithmus diese Beziehungen im Modell annähert („Learned Representation“) – etwa durch Gruppierung in Cluster, durch Abstände in einem Merkmalsraum, durch Zuordnung zu Kategorien oder durch andere projektionelle Verfahren[8][10]. Jedes bekannte Lernverfahren lässt sich als Kombination dieser beiden Achsen begreifen und somit in einem Feld der Tabelle verorten[11][12].

Abb. 1: Schematische Darstellung einiger Beziehungstypen (Spalten) in Daten und Approximationsarten (Zeilen) im I-Con-Framework【28†】. Beispielsweise basieren (A) räumliche Beziehungen auf Abständen im Merkmalsraum (z. B. Nachbarn innerhalb einer Gauß- oder Student-t-Verteilung), (B) diskrete Paar-Beziehungen auf Zuordnungen wie positiven Paaren (etwa Datenaugmentierungen desselben Objekts) oder cross-modalen Paaren (z. B. Bild-Text-Zuordnungen) bzw. Label-Zugehörigkeit, (C) Cluster-Beziehungen auf gemeinsamer Gruppenzugehörigkeit und (D) Graph-Beziehungen auf Nachbarschaften in einem Netzwerk【28†】. I-Con definiert diese Kategorien formaler als Verteilungen, die Nachbarschaften zwischen Punkten darstellen (z. B. kontinuierliche Distanzgewichte vs. binäre Zugehörigkeiten), was dann die Zeilen der Periodentafel bestimmt. Jeder Algorithmus erhält ein Feld in der Tabelle entsprechend der Kombination aus genutzter Beziehungsart und gewählter Annäherungsmethode.

Durch diese Strukturierung konnte das Team über 20 verschiedene Lernverfahren in das System einordnen[1]. Einige Beispiele:

· Clustering (z. B. K-Means): berücksichtigt die räumliche Nähe zwischen Punkten und bildet Cluster als Annäherung – Datenpunkte werden gruppiert, sodass nahe beieinander liegende Punkte im selben Cluster landen[11][13].

· Dimensionsreduktion (z. B. PCA oder t-SNE): betrachtet ebenfalls Distanzähnlichkeiten in hochdimensionalen Daten und projiziert die Punkte in niedrigere Dimensionen, wobei die Nachbarschaften möglichst erhalten bleiben[11][14].

· Graph-Algorithmen (z. B. Spektrales Clustering): nutzen Graph-Konnektivität (Wer ist mit wem verbunden?) und ordnen Punkte Clustergruppen zu, basierend auf den Verbindungen im Graphen[11].

· Überwachtes Lernen (z. B. Klassifikation mit Kreuzentropie): basiert auf Label-Beziehungen (gehören zwei Datenpunkte zur selben Klasse?) und platziert Datenpunkte im Merkmalsraum so, dass gleiche Klassen nahe beieinander liegen[15][16]. (Ein Spam-Filter etwa lernt, E-Mails mit dem Label „Spam“ zusammenzuhalten und von „Nicht-Spam“ zu trennen[17].)

· Selbstüberwachtes Lernen (z. B. Kontrastives Lernen): nutzt Ähnlichkeitspaare, etwa ob zwei Datenpunkte aus der gleichen Quelle stammen (etwa zwei Ansichten desselben Bildes). Es zieht ähnliche Paare zusammen und stößt unähnliche auseinander im Merkmalsraum[11].

· Große Sprachmodelle (LLMs, z. B. Transformermodelle): betrachten Sequenz-Beziehungen, d. h. welche Wortfolge auf einen gegebenen Text folgt, und lernen eine hochdimensional eingebettete Darstellung, in der kontextpassende Wörter nah beieinander liegen[1][16].

Trotz der sehr verschiedenen Aufgaben zeigen sich in I-Con wiederkehrende “Verbindungstypen”, was die Einordnung in tabellarische Form ermöglicht[18]. Jede Zelle der Tabelle steht für eine bestimmte Kombination aus Datenbeziehung und Approximationsmethode. Abbildung 2 zeigt eine vereinfachte Version dieser Periodentafel des ML. Hier sind die bekannten Algorithmen als farbige Felder mit ihren Namen und (häufig) dem Jahr der ursprünglichen Veröffentlichung eingetragen.

Abb. 2: Schematische Periodentafel des maschinellen Lernens (vereinfacht nach Hamilton et al., 2025)【27†】. Die Spalten (oben, Supervisory Signal) repräsentieren verschiedene Arten von „echten“ Beziehungen zwischen Datenpunkten – von kontinuierlichen Distanzgewichten (Gauß- und Student-t-Verteilungen, Uniform k-Neighbors) über Paar-Beziehungen (Positive Pairs, Cross-Modal Pairs) und Klassengleichheit (Uniform over Classes) bis zu expliziten Zuordnungen zwischen Daten und Labels (Data-Label Pairs). Die Zeilen (links, Learned Representation) entsprechen den Annäherungs- bzw. Modellierungsstrategien, wie diese Beziehungen intern abgebildet werden – beispielsweise kontinuierliche Gaußsche Verteilungen verschiedener Varianzgrenzen, Student-t-Verteilungen, diskrete Cluster-Zugehörigkeiten usw. Jedes Feld der Tabelle entspricht einem Algorithmus oder einer Verlustfunktion. Farbcodiert sind u. a. Dimensionsreduktion (blau), Clustering (orange), selbstüberwachtes Lernen (SSL) auf ein modality (rosa) oder mehreren Modalitäten (violett), sowie überwachtes Lernen (grün). Man erkennt, dass viele historisch getrennt entwickelte Methoden – von Pearson’s PCA (1901) bis zu modernen Contrastive-Learning-Methoden (2020er) – in diesem Schema nebeneinander Platz finden und oft nur durch die Art der Nachbarschaftsdefinition oder Approximation differieren【27†】. Die grauen Felder markieren teils theoretische Kombinationen, in denen noch kein etablierter Algorithmus existiert – genau diese Lücken dienen als Inspirationsquelle für neue Entwicklungen.

Ein periodisches System mit Lücken: Eine der spannendsten Eigenschaften dieser Einordnung ist ihre Vorhersagekraft. So wie Dmitri Mendelejews Periodensystem der Elemente einst Lücken für unentdeckte chemische Elemente ließ, enthüllte auch die ML-Periodentafel unbesetzte Felder – Kombinationen von Beziehungstyp und Algorithmusprinzip, für die es bislang kein bekanntes Verfahren gab[2][19]. Die Forscher berichten, dass nach Eintragung aller vertrauten Methoden noch etliche „Leerstellen“ übrig blieben[19]. Diese Lücken sind jedoch keine theoretischen Kuriositäten: Vielmehr deuten sie auf Algorithmus-Konzepte hin, die plausibel existieren könnten, aber noch nicht erfunden wurden[19]. I-Con liefert somit eine Art Landkarte oder Baukasten, in dem ML-Wissenschaftler gezielt nach neuen Verfahren suchen können, anstatt sich nur auf Intuition oder Zufall zu verlassen[20]. „Es ist nicht nur eine Metapher“, betont Erstautorin Shaden Alshammari. „Wir beginnen, maschinelles Lernen als strukturiertes System zu begreifen – als einen Raum, den wir gezielt erforschen können, statt uns blind durchzuraten.“[21]

Um das abstrakte Konzept greifbar zu machen, zogen die Entwickler von I-Con einen anschaulichen Vergleich heran[22][23]: Stellen wir uns ein großes Festbankett vor. Jeder Gast (Datenpunkt) hat Freunde (ähnliche Datenpunkte) im Saal. Die Gäste sollen nun auf Tische verteilt werden, wobei möglichst Freunde am selben Tisch sitzen[23]. Natürlich kann keine Sitzordnung alle Freundschaften perfekt berücksichtigen, aber eine gute Anordnung setzt so viele Freunde wie möglich zusammen. In dieser Analogie entsprechen die echten sozialen Netzwerke der Gäste den wahren Datenbeziehungen, und die Tischgruppen repräsentieren die Cluster oder Kategorien, die ein Algorithmus im Modell bildet[23]. Unterschiedliche ML-Algorithmen ähneln nun verschiedenen Strategien der Sitzordnung – etwa streng nach Cliquen (Clustering), nach gemeinsamen Interessen (Features), nach einem Hauptevent (Label) oder zufällig gemischt etc.[24][25]. I-Con ist dann wie ein universelles Regelwerk im Hintergrund, das aufzeigt, dass all diese Strategien letztlich dasselbe Ziel haben: Möglichst viele echte Verbindungen (Freundschaften) in der vereinfachten Struktur (Tischverteilung) abzubilden[26][27].

2. Konkrete Anwendungsbeispiele und Nutzen in der Praxis

Die Periodentafel des ML ist nicht nur eine theoretische Spielerei – sie hat bereits in ersten Experimenten zu greifbaren Verbesserungen von KI-Modellen geführt. Ein eindrucksvolles Beispiel lieferte das MIT-Team selbst, indem es eine der identifizierten Lücken im Tableaus füllte[28][29]:

· Neuer Bildklassifizierungs-Algorithmus (ohne Labels): In einem bisher leeren Feld der Tabelle kombinierten die Forscher Elemente aus der kontrastiven Repräsentationslern-Methode mit solchen der Clusteranalyse. Konkret übernahmen sie einen Debiasing-Trick aus dem Contrastive Learning und integrierten ihn in einen Clustering-Algorithmus[29][30]. Das Ergebnis war ein neues Verfahren zur Bilderkennung, das ganz ohne menschliche Labels auskommt. In Tests auf dem populären ImageNet-1K-Datensatz (eine große Benchmark für Bildklassifikation) erzielte dieser Ansatz eine 8 % höhere Genauigkeit als der bisherige Stand der Technik für unlabelte Bildklassifikation[31][29]. Mit anderen Worten: Durch geschicktes Verschmelzen zweier zuvor getrennter Methoden entdeckte man ein leistungsfähigeres Modell, das in der Lage ist, ungekannte Bilder allein aufgrund inhärenter Strukturen zu gruppieren und korrekt zu klassifizieren – ein bedeutender Fortschritt für unüberwachtes Lernen in der Computer Vision.

Diese Verbesserung um 8 % ist bemerkenswert, da Fortschritte auf bekannten Benchmark-Datensätzen oft nur in kleinen Schritten gemessen werden. Sie unterstreicht, welches Potenzial in der kreativen Kombination bisher getrennter Ansätze steckt, wenn man dabei von einem vereinheitlichenden Rahmen wie I-Con geleitet wird[28][29]. Der erwähnte Debiasing-Kunstgriff veranschaulicht das: In ihrem Framework interpretiert I-Con eine bestehende Technik aus dem Contrastive Learning – nämlich gezielt schwache Ähnlichkeiten zwischen allen Datenpunkten einzuführen, um Überanpassungen an triviale Gemeinsamkeiten zu vermeiden – als allgemeines Werkzeug, das sich auch auf ganz andere Lernprobleme übertragen lässt[30]. Ursprünglich wurde dieses Verfahren entwickelt, um verzerrte Darstellungen in selbstüberwachten Modellen zu verhindern; angewandt auf einen Clustering-Algorithmus erhöhte es dort die Robustheit und Genauigkeit der Gruppierungen deutlich[32][33]. Durch I-Con ließ sich also erkennen, dass ein „Bias-Korrektur“-Element aus Methode A (Kontrastives Lernen) der Methode B (Clustering) genau das fehlende Puzzlestück liefern konnte, um deren Leistung zu steigern.

Darüber hinaus zeigt das I-Con-Framework sein Potential als Ideen-Inkubator: Die Forscher betonen, dass das Periodensystem flexibel erweiterbar ist – neue Reihen und Spalten können hinzugefügt werden, um weitere Beziehungstypen oder Approximationstechniken abzudecken, sofern die Zukunft der KI neue Paradigmen hervorbringt[34][35]. Denkbar sind etwa zusätzliche Dimensionen für temporale Zusammenhänge (Zeitreihen oder dynamische Systeme) oder für multimodale Beziehungen (das gleichzeitige Lernen aus z. B. Bild und Text)[35]. Tatsächlich enthält die heutige Tabelle bereits erste multimodale Ansätze – z. B. CLIP, ein Modell, das Bilder und Texte in einen gemeinsamen Raum einbettet, erscheint als eigener Eintrag (Kategorie „Cross-Modal Pairs“)[15][36]. Solche Fälle verdeutlichen, dass I-Con keine starre Klassifikation ist, sondern ein lebendes Gerüst, das mit dem Fortschritt der KI mitwachsen kann[35][18].

Für die ML-Community könnte dies eine erhebliche Beschleunigung des Innovationsprozesses bedeuten. Anstatt mühsam jeden neuen Lernansatz von Grund auf neu zu entwickeln, kann man das Periodensystem zu Rate ziehen, um gezielt existierende Elemente zu kombinieren oder systematisch nach Lücken zu suchen, die vielversprechend erscheinen[37][38]. I-Con dient damit als Kompass in der unüberschaubaren Landschaft der Verfahren. Mark Hamilton, Mitautor der Studie, beschreibt es als „Toolkit, das es Forschern erlaubt, neue Algorithmen entwerfen, ohne alte Ideen jedes Mal neu erfinden zu müssen“[39][40]. Dieses systematische „Remixen“ von Ideen hat nicht nur bei der Bildklassifikation Früchte getragen, sondern ließe sich prinzipiell auf beliebige ML-Bereiche anwenden – sei es bei Datenvorverarbeitung, Bias-Reduktion (wie gezeigt) oder sogar im Entwurf von Architekturen für Neuronale Netze.

Ein weiterer Nutzen liegt in der Wissensvermittlung und Übersicht: Für Nachwuchsforscher und Studierende kann die Periodentafel des ML als visuelle Landkarte dienen, um die Vielzahl an Algorithmen und Loss-Funktionen einzuordnen[41][42]. Anstatt Dutzende Lernmethoden als isolierte „Rezepte“ zu betrachten, können sie erkennen, welche grundlegenden Prinzipien dahinterstehen und wie Methoden miteinander verwandt sind. Dies fördert ein tieferes Verständnis und verhindert, dass das Rad immer wieder neu erfunden wird – ein nicht zu unterschätzender Vorteil in einem Feld, in dem jährlich zigtausende Paper veröffentlicht werden und der Überblick schwerfällt[42].

Die positive Resonanz aus der Fachwelt bestätigt die Bedeutung dieses Ansatzes. Yair Weiss, Professor an der Hebräischen Universität Jerusalem, der nicht an der Arbeit beteiligt war, kommentiert: „In einer Zeit, in der scheinbar unendlich viele ML-Papers erscheinen, sind Arbeiten, die existierende Algorithmen vereinheitlichen und verbinden, von enormer Wichtigkeit – und doch äußerst selten. I-Con ist ein exzellentes Beispiel für einen solchen vereinheitlichenden Ansatz.“[43] Dieser Zuspruch unterstreicht, dass das I-Con-Periodensystem einen Nerv getroffen hat: Es bringt Ordnung in das Chaos, zeigt verborgene Zusammenhänge auf und ebnet den Weg für gezielte neue Entdeckungen, anstatt nur auf Trial-and-Error zu setzen[40][43].

3. Vergleich mit ähnlichen Ansätzen zur Systematisierung des maschinellen Lernens

Der Gedanke, eine einheitliche Struktur oder Theorie für die Vielzahl von KI- und ML-Methoden zu finden, ist nicht völlig neu – doch bisherige Ansätze unterscheiden sich teils stark in Ziel und Ausführung. Im Folgenden werden einige bedeutende vergleichbare oder konkurrierende Konzepte vorgestellt und dem I-Con-Framework gegenübergestellt:

Paradigmen-Ansatz („Master-Algorithmus“ nach Domingos): Eine eher philosophische Einordnung stammt von Pedro Domingos, der 2015 in seinem Buch The Master Algorithm fünf große „Stämme“ des maschinellen Lernens beschrieb[44]. Diese Gruppen – Symbolisten (induktive Logik), Konnektionisten (neuronale Netze), Evolutionäre (genetische Algorithmen), Bayes’sche Lernende (probabilistische Modelle) und Analogisten (instanzbasiertes Lernen) – repräsentieren unterschiedliche Schulen mit jeweils eigenen Meister-Algorithmen[44]. Domingos spekulierte, dass sich diese Ansätze zu einem ultimativen „Master-Algorithmus“ vereinen ließen, der die Stärken aller fünf Tribes kombiniert[44]. Im Gegensatz zur Periodentafel des ML war dies allerdings kein konkretes technisches Framework, sondern eher eine Vision. Während Domingos’ Idee die Vereinigung der ML-Paradigmen auf hoher Ebene anstrebt, liefert I-Con eine feinkörnigere, mathematisch präzise Vereinigung auf Ebene der Loss-Funktionen und Algorithmen. Beide teilen das Ziel einer einheitlichen Sicht, doch I-Con geht den praktischeren Weg, indem es tatsächlich Formalismen und Strukturen bereitstellt, in denen man vorhandene Methoden einordnen und neue gezielt ableiten kann.
Periodensystem der KI nach Hammond (2019): Bereits einige Jahre vor I-Con wurde ein sogenanntes „Periodensystem der Künstlichen Intelligenz“ von Kristian Hammond vorgestellt[45], unterstützt vom deutschen Digitalverband Bitkom. Hammonds System zielte allerdings vorrangig darauf ab, KI-Funktionalitäten modular zu beschreiben, um Unternehmen und Entscheidern einen Überblick zu geben. Er definierte 28 „KI-Elemente“, die als Bausteine für Anwendungen dienen, und ordnete sie drei Oberkategorien zu – Assess (Bewerten), Infer (Folgern) und Respond (Reagieren)[45][46]. Diese Gruppen entsprechen typischen Verarbeitungsschritten in KI-Prozessen. Beispielsweise galt „Audio Recognition (Ar)“ als Element in der Assess-Kategorie, das Geräusche erkennt und klassifiziert[47]. Hammonds Periodensystem hat also eher den Charakter eines Baukastens für Anwendungsfunktionen. Zwar steckt auch hier die Idee dahinter, KI in atomare Komponenten zu zerlegen, die man beliebig kombinieren kann, um komplexe Lösungen zu bauen[46]. Allerdings unterscheidet es sich deutlich vom I-Con-Framework: Hammond orientiert sich an funktionalen Anwendungsbausteinen (wie Spracherkennung, Bildanalyse, Entscheidungsfindung), während I-Con auf algorithmischer Ebene ansetzt und die theoretischen Lernprinzipien strukturiert. Man könnte sagen, Hammonds Tabelle ist für das Verständnis der Fähigkeiten von KI-Systemen nützlich (und um Angebote verschiedener KI-Produkte zu vergleichen)[48][49], während I-Con für das Verständnis der Lernmethoden und ihrer Mathematik bahnbrechend ist. Beide verwenden die Periodentafel-Metapher, aber mit unterschiedlichem Fokus: Praxisnahe KI-Komponenten vs. wissenschaftliche Algorithmen-Theorie.
Information-Bottleneck-Framework (2025): Ganz aktuell – quasi zeitgleich mit I-Con – wurde von einer Gruppe Physiker an der Emory University ein weiterer vereinheitlichender Rahmen vorgeschlagen, der ebenfalls explizit als eine Art „Periodensystem der KI-Methoden“ beschrieben wird[50]. Dabei handelt es sich um das Variational Multivariate Information Bottleneck (VMIB), veröffentlicht 2025 in der Journal of Machine Learning Research. Dieser Ansatz basiert auf der Informationstheorie und formuliert ein allgemeines Prinzip: KI-Modelle sollten unterschiedliche Eingabedaten so weit komprimieren, dass nur die für die Vorhersage wesentlichen Informationen erhalten bleiben[50][51]. Die Entwickler fanden heraus, dass viele erfolgreiche KI-Verfahren auf genau dieses simple Grundprinzip zurückgeführt werden können – ein Abwägen zwischen Datenkompression und Rekonstruktionstreue[52][53]. Im Training entspricht das der Feinjustierung einer Loss-Funktion, die bestimmte Information ignoriert und andere bewahrt. Nemenman et al. beschreiben ihr Framework als einen stufenlos verstellbaren „Regler“, der je nach Problem mehr oder weniger Details durchlässt[54]. Interessanterweise erklären sie: „Das ergibt gewissermaßen ein Periodensystem der KI-Methoden. Verschiedene Verfahren landen in verschiedenen Zellen, je nachdem welche Information ihre Loss-Funktion behält oder verwirft.“[50]. So ließen sich z. B. extrem datenkomprimierende Verfahren (wie stark reguläre Klassifikatoren, die nur Label-relevante Features speichern) von eher rekonstruktionsorientierten Verfahren (wie Autoencoder, die möglichst viel vom Input bewahren) durch diesen “Info-Regler” unterscheiden und einordnen. Das VMIB-Framework hat in ersten Demonstrationen gezeigt, dass es Loss-Funktionen systematisch herleiten kann und damit oft effizientere Lernprozesse mit weniger Trainingsdaten erlaubt[55][56]. Obwohl sich die technischen Details unterscheiden, teilen VMIB und I-Con eine wichtige Philosophie: Suche nach einer einheitlichen Informationsgeometrie, die diverse Algorithmen verbindet[57][58]. VMIB tut dies, indem es die Menge an beibehaltenen vs. verworfenen Informationen als Ordnungskriterium nutzt; I-Con tut es, indem es die Art von Beziehungen und deren Nachbildung als Ordnungskriterium nutzt. Man kann diese Ansätze als komplementär ansehen – beide bringen ein physikalisch-mathematisches Ordnungsprinzip ins KI-Wirrwarr, jedoch mit unterschiedlicher Perspektive (Dateninformation vs. Datenbeziehungen). Gemeinsam ist beiden, dass sie den Entwurf neuer Algorithmen erleichtern sollen: VMIB gibt Entwicklern ein Prinzip an die Hand, mit dem sie für eine gegebene Aufgabenstellung die passende Loss-Funktion zusammenstellen können[59][60], während I-Con konkrete kombinatorische Rezepte liefert, wie bewährte Methoden zu neuen kombiniert werden können[37].
Einheitsmodelle („Foundation Models“): Neben den theoretischen Vereinheitlichungsbestrebungen gibt es in der KI-Forschung auch den Trend, praktisch immer allgemeinere Modelle zu schaffen, welche viele Aufgaben zugleich bewältigen können. Beispiele sind große vortrainierte Modelle wie GPT-4 oder Multimodal-Modelle à la CLIP oder Gato, die Sprach-, Bild- und andere Aufgaben in einem System vereinen. Diese sogenannten Foundation Models werden durch riesige Datensätze und Rechenleistung trainiert, um anschließend in vielseitiger Weise einsetzbar zu sein. Ihr Ziel ist gewissermaßen ein universeller KI-Baukasten, der durch Anpassung (Fine-Tuning) für spezielle Aufgaben genutzt werden kann. Im Kontext der Diskussion um Vereinheitlichung lässt sich das so einordnen: Foundation Models integrieren verschiedene Anwendungsdomänen und Datentypen in einem Modell, während Frameworks wie I-Con oder VMIB verschiedene Algorithmusprinzipien in einer Theorie integrieren. Mit anderen Worten, Foundation Models liefern eine empirische Einheitslösung (eine einzige Netzwerk-Architektur lernt alles Mögliche), ohne jedoch die Vielfalt der Algorithmen formal zu erklären. I-Con hingegen bietet eine theoretische Einheitsbeschreibung, die beleuchtet, warum unterschiedliche Lernansätze funktionieren und wie sie zueinander in Beziehung stehen[40]. Diese beiden Ansätze sind nicht widersprüchlich, sondern ergänzen sich: So ist CLIP als multimodales Contrastive-Learning-Modell selbst ein Baustein in I-Cons Periodentafel, und auch große Sprachmodelle lassen sich als ein Spezialfall in diesem Rahmen sehen[1]. I-Con könnte künftig sogar dabei helfen, gezielt neue Foundation Models zu entwerfen, indem man systematisch überlegt, welche Art von Datenbeziehungen ein allgemeines Modell noch integrieren könnte.

Zusammengefasst lässt sich sagen, dass I-Con derzeit einen der umfassendsten und formal präzisesten Versuche darstellt, maschinelles Lernen zu ordnen und zu vereinheitlichen. Frühere Konzepte wie Domingos’ Master-Algorithmus oder Hammonds KI-Periodensystem legten Grundsteine für ein holistisches Denken über KI, waren aber entweder konzeptionell abstrakt oder auf bestimmte Anwendungsszenarien begrenzt. Neuere forschungsnahe Ansätze wie das Information-Bottleneck-Framework teilen I-Cons wissenschaftlichen Geist und verstärken den Trend hin zu vereinheitlichenden Theorien in der KI. Diese konkurrierenden Ideen zeigen, dass die Community erkannt hat: In der Menge der Teildisziplinen und Modelle liegen tiefergehende gemeinsame Prinzipien verborgen – diese aufzudecken, kann der Schlüssel zu effizienteren, verständlicheren und gezielter einsetzbaren KI-Systemen sein.

Fazit und Ausblick

Die Periodentafel des maschinellen Lernens markiert einen wichtigen Meilenstein auf dem Weg, KI als systematische Wissenschaft zu begreifen. Indem das I-Con-Framework über 20 verschiedene Algorithmen – von über hundert Jahren Forschung – auf eine einheitliche Gleichung und Struktur zurückführt, legt es die verborgene Ordnung im scheinbaren Wildwuchs der ML-Methoden frei[61]. Was früher als disparate Sammlung von Techniken erschien, erweist sich nun als eng verknüpft durch einen gemeinsamen Informationsgehalt. Ähnlich wie das chemische Periodensystem Wissen strukturiert und Vorhersagen über neue Elemente ermöglichte, organisiert I-Con bestehendes ML-Wissen, prognostiziert neue Verfahren und dient als Kompass für Innovationen[61].

Für Praktiker bedeutet dies eine neue Ära des informationsgeleiteten Experimentierens: Anstatt im Dunkeln zu stochern, kann man fundiert fragen: „Welche Kombination von Beziehungen und Darstellungsweisen wurde noch nicht ausprobiert?“ – und genau dort ansetzen, wie das 8 %-Beispiel eindrucksvoll zeigte[29][30]. Zugleich macht die verständliche Struktur es einfacher, Wissen zu vermitteln und Zusammenarbeit zu fördern, da Forscher unterschiedlichster Spezialisierungen eine gemeinsame Sprache finden, um ihre Methoden einzuordnen[42]. Die Öffnung dieses „Baukastens“ könnte auch eine Demokratisierung der KI-Entwicklung fördern[62][63]: Wenn die Prinzipien bekannt und modular verfügbar sind, können auch kleinere Teams ohne gigantische Ressourcen neue Ideen generieren – analog zu einem Chemiker, der mit dem Periodensystem im Hinterkopf gezielt neue Verbindungen kreiert.

Allerdings gehen mit rascher Innovation auch Verantwortungsfragen einher[62]. Wenn neue Algorithmen schneller ersonnen werden können, muss ebenso sichergestellt werden, dass sie verlässlich und ethisch unbedenklich sind. Die Entwickler von I-Con betonen, dass Transparenz und Verständnis – die ihr Framework ja verbessert – letztlich auch dazu beitragen, KI vertrauenswürdiger zu machen[64][60]. Ein systematisches Fundament erleichtert es, Annahmen hinter Algorithmen offen zu legen (z. B. welche „Verbindungen“ ein Modell lernt und welche nicht) und so bias-behaftete oder ungeeignete Methoden frühzeitig zu identifizieren[65][66].

Insgesamt lässt die Periodentafel des ML hoffen, dass das Feld der künstlichen Intelligenz übersichtlicher und gezielter steuerbar wird. Während sie natürlich noch nicht alle Rätsel des Lernens löst – sie ist kein „Master-Algorithmus“ im Alleingang –, so zeigt sie doch, dass selbst in einem so komplexen Gebiet wie ML einfache, elegante Strukturen entdeckt werden können[67]. Diese Strukturen helfen uns, besser zu verstehen, wie Lernen eigentlich funktioniert: Im Kern scheint Lernen „die Kunst zu sein, Beziehungen abzubilden“[68]. Mit I-Con und ähnlichen Rahmenwerken sind wir einen Schritt weiter, dieses Herzstück der KI zu erkennen. Die Forschungsgemeinschaft steht nun am Anfang, diesen Raum systematisch zu erkunden – und die freien Felder der Periodentafel mit den Entdeckungen von morgen zu füllen[67][68].

Quellen: Fachartikel und Pressemitteilungen von MIT und Microsoft Research[69][1]; Tech-News und Blogs (TechExplorist, TechRepublic)[70][71]; wissenschaftliche Publikationen (ICLR 2025 I-Con Paper, JMLR 2025)[72][50]; Expertenkommentare[43]. (Alle Quellen zuletzt abgerufen im Dezember 2025.)

[1] [3] [4] [7] [13] [15] [16] [18] [19] [20] [21] [22] [23] [29] [30] [36] [37] [67] [68] A periodic table for machine learning - Microsoft Research

https://www.microsoft.com/en-us/research/articles/a-periodic-table-for-machine-learning/

[2] [28] [31] [32] [34] [39] [40] [43] [69] “Periodic table of machine learning” could fuel AI discovery | MIT News | Massachusetts Institute of Technology

https://news.mit.edu/2025/machine-learning-periodic-table-could-fuel-ai-discovery-0423

[5] [6] [8] [9] [10] [11] [12] [14] [24] [25] [26] [27] [35] [41] [42] [61] [62] [63] The Periodic Table of Machine Learning: A Revolutionary Framework by MIT Researchers | by Qasim Al-Ma'arif | Medium

https://medium.com/@datailm/the-periodic-table-of-machine-learning-a-revolutionary-framework-by-mit-researchers-3036a40f45c2

[17] [33] [70] A periodic table of machine learning

https://www.techexplorist.com/periodic-table-machine-learning/99078/

[38] [71] 20+ Machine Learning Methods in Groundbreaking Periodic Table From MIT, Google, Microsoft

https://www.techrepublic.com/article/news-machine-learning-periodic-table/

[44] The Master Algorithm - Wikipedia

https://en.wikipedia.org/wiki/The_Master_Algorithm

[45] [46] [47] [48] [49] »Periodensystem der Künstlichen Intelligenz« - Automation - Elektroniknet

https://www.elektroniknet.de/automation/periodensystem-der-kuenstlichen-intelligenz.162972.html

[50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [64] [65] [66] 'Periodic table' for AI methods aims to drive innovation

https://techxplore.com/news/2025-12-periodic-table-ai-methods-aims.html

[72] I-Con: A Unifying Framework for Representation Learning | OpenReview

https://openreview.net/forum?id=WfaQrKCr4X

MacMalschman

Dienstag, 23. Dezember 2025

Die Periodentafel des maschinellen Lernens: Ein neues System zur Einordnung von KI-Algorithmen

1. Struktur und Funktionsweise der Periodentafel des ML

2. Konkrete Anwendungsbeispiele und Nutzen in der Praxis

3. Vergleich mit ähnlichen Ansätzen zur Systematisierung des maschinellen Lernens

Fazit und Ausblick

Keine Kommentare:

Kommentar veröffentlichen