Hat die Künstliche Intelligenz „Polnisch lieben gelernt“?

Studie zeigt: Polnisch liefert die besten Ergebnisse bei KI-Anweisungen

Teilen:
Künstliche Intelligenz, Polnisch, KI-Studie, präziseste Sprache für das Prompten, KI, polnische Sprache, Polen,

Polnisch wurde als präziseste Sprache für das Prompten von Künstlicher Intelligenz (KI) ausgezeichnet. Laut einer neuen Analyse erzielt die polnische Sprache die besten Ergebnisse beim Erteilen von Anweisungen an große Sprachmodelle. Allerdings gibt es dabei auch eine Herausforderung: Für Maschinen ist Polnisch ein vergleichsweise ressourcenarmer Sprachraum.

Polnisch – schwer für Menschen, aber ideal für Maschinen

Bisher galt Polnisch weltweit als eine der schwierigsten Sprachen zum Erlernen – komplizierte Grammatik, Orthografie und Flexion machten sie zu einer wahren Herausforderung, selbst für Linguisten. Laut der Organisation “Ethnologue” existieren weltweit über 7.000 Sprachen, wobei Polnisch regelmäßig zu den zehn schwierigsten gezählt wird.

Doch während Menschen mit dieser Komplexität kämpfen, scheint die Künstliche Intelligenz gut damit zurechtzukommen.

Anzeige

Englisch ist nicht am effizientesten

Wissenschaftler der University of Maryland und Mitar eiter von Microsoft testeten große Sprachmodelle (LLMs), um herauszufinden, wie gut sie mit unterschiedlichen natürlichen Sprachen umgehen. Untersucht wurden 26 Sprachen und diverse KI-System, darunter Modelle von OpenAI (o3-mini-high), Google Gemini 1.5 Flash, Qwen2.5 (7B und 72B), Llama 3.1 (8B), Llama 3.3 (70B) und DeepSeek-R1.

Die Forschenden erstellten umfangreiche, kontextreiche Prompts – teils mit über 100.000 Token – und bewerteten das Verständnis sowie die Antwortqualität der Modelle. Das Ergebnis wurde im Benchmark OneRuler veröffentlicht.

Das Resultat überraschte selbst die Expertinnen und Experten: Polnisch belegte den ersten Platz, während Englisch, die dominierende Trainingssprache der KI, nur Rang sechs erreichte.

„Unsere Experimente zeigen eine wachsende Leistungslücke zwischen ressourcenreichen und -armen Sprachen, wenn man den Kontext von 8.000 auf 128.000 Token erweitert. Überraschenderweise ist Englisch dabei nicht die leistungsfähigste Sprache – Polnisch ist es“, heißt es im Bericht der Forscher.

Kontextlänge als Schlüsselfaktor

Eine weitere Beobachtung: Je länger der Kontext, desto stärker fällt der Unterschied zwischen den Sprachgruppen aus. Bei 8.000 Token lag die Leistungsdifferenz bei 11 Prozent, bei 128.000 Token bereits bei 34 Prozent.

Das ist relevant, weil das Verstehen langer Kontexte entscheidend für reale Anwendungen großer Sprachmodelle ist – etwa bei Textzusammenfassungen, Analysen großer Dokumentenmengen oder komplexen Wissensabfragen.

Wenig Trainingsdaten – hohe Präzision

Im Rahmen der Studie wurden die Modelle anhand von sieben synthetischen Aufgaben getestet, die in zwei Kategorien unterteilt waren:

  • Suche („Nadel im Heuhaufen“ – das Auffinden nicht existierender Informationen im Text)
  • Aggregation (Ermittlung der häufigsten Wörter in langen Listen).

Die Tests erfolgten mithilfe von vier Kontextlängen: 8.000, 32.000, 64.000 und 128.000 Token.

Das Fazit: Polnisch ist die effizienteste Sprache zum Prompten. Trotz des geringen Datenvolumens, welches für das Training verfügbar ist, liefern Modelle in polnischer Sprache präzisere, weniger fehleranfällige und analytisch stärkere Ergebnisse.

Das Forschungsteam – Yekyung Kim, Jenna Russell, Marzena Karpińska und Mohit Iyyer – veröffentlichte die Studie „One ruler to measure them all: Benchmarking multilingual long-context language models“. Darin heißt es, dass Polnisch insbesondere bei langen Prompts von 64.000 bis zu 128.000 Token eine durchschnittliche Effektivität von 88 Prozent erreicht.

Zum Vergleich: Englisch erzielte knapp 84 Prozent, während Chinesisch, trotz enormer Trainingsdatenmengen, nur auf Rang 23 von 26 landete – mit einer Erfolgsquote von 62 Prozent.

Ranking der Sprachleistung beim Prompten:

RangSpracheEffektivität
1Polnisch88 %
2Französisch87 %
3Italienisch86 %
4Spanisch85 %
5Russisch84 %
6Englisch83,9 %
7Ukrainisch83,5 %
8Portugiesisch82 %
9Deutsch81 %
10Niederländisch80 %
11Norwegisch79 %
12Schwedisch78 %
13Dänisch77 %
14Ungarisch76 %
15Finnisch75 %
16Tschechisch73 %
17Japanisch72 %
18Vietnamesisch71 %
19Persisch70 %
20Serbisch69 %
21Koreanisch66 %
22Hindi65 %
23Chinesisch62,1 %
24Tamil61 %
25Swahili55 %
26Sesotho45 %

Quelle: rp

Foto: freepik

Anzeige
Anzeige
Teilen:
0 0 Bewertungen
Article Rating
Abonnieren
Benachrichtigen bei
guest
0 Comments
Älteste
Neueste Meistbewertet
Inline-Feedbacks
Alle Kommentare anzeigen
Mehr von PolenJournal.de
adddddd

Immer bestens informiert mit PolenJournal.de

Top-News, Tipps und Ratgeber für den Alltag und Urlaub in Polen – kostenlos an Ihre E-Mail-Adresse in nur zwei Schritten:

1. Geben Sie Ihre E-Mail Adresse ein
2. Klicken Sie auf „kostenlos abonnieren“

Mit dem Anklicken von „kostenlos abonnieren“ erteile ich die Einwilligung, dass Digital Monsters Sp. z.o.o mir Newsletter per E-Mail mit Produktangeboten und/oder Medienangeboten auf Basis meiner persönlichen Nutzung zuschickt. Meine Einwilligung kann ich jederzeit widerrufen.

Wenn Sie unsere Newsletter nicht mehr erhalten möchten, können Sie diese jederzeit abbestellen, indem Sie einfach auf den Link „Abbestellen“ in der Fußzeile des Newsletters klicken oder eine E-Mail an redaktion@polenjournal.de senden.

Das könnte Sie auch interessieren:
Anzeige
Aufgrund Ihres Blockers zeigen wir PolenJournal.de nicht an.
Liebe Leserinnen, liebe Leser, guter Journalismus hat nicht nur einen Wert, sondern kostet auch Geld. PolenJournal.de finanziert sich durch Werbeeinnahmen. Deaktivieren Sie Ihre Blocker, damit die Inhalte auf PolenJournal.de weiterhin kostenlos bleiben können.
So deaktivieren Sie Ihre Blocker
  1. Klicken Sie auf das Symbol Ihres Werbe- oder Cookiebanner-Blockers in der oberen rechten Ecke Ihres Browsers.
  2. Klicken Sie auf den farbigen Regler, der Ihnen anzeigt, dass Werbung auf PolenJournal.de geblockt wird.
  3. Aktualisieren Sie die Seite und genießen Sie kostenlose Inhalte auf PolenJournal.de.

A Sale Promotion

A description of the promotion and how the visitor could claim the discount