BCP 47 Sprach-Tag

Ein BCP 47 Sprach-Tag ist eine Zeichenfolge, die eine menschliche Sprache präzise in Bezug auf die Grundsprache und optional auch das Schriftsystem und den Dialekt angibt. Zum Beispiel spezifiziert en Englisch, aber en-GB und en-US geben präziser Britisches Englisch bzw. Amerikanisches Englisch an.

BCP 47 Sprach-Tags werden überall auf der Webplattform verwendet, wo ein Feature so gestaltet ist, dass es unterschiedliche Ergebnisse abhängig von der angegebenen Sprache ausgibt, um Internationalisierung zu unterstützen.

Beispiele umfassen:

BCP 47 Syntax

Die vollständige BCP 47 Syntax ist in RFC 5646 spezifiziert. Sie ist in der Lage, äußerst spezifische Sprachdialekte zu identifizieren, aber die meisten Anwendungsfälle sind viel einfacher.

Ein Sprach-Tag besteht aus durch Bindestriche getrennten Subtags, wobei jeder Subtag eine bestimmte Eigenschaft der Sprache angibt. Die drei häufigsten Subtags sind:

Sprach-Subtag

Ein 2-oder-3-Zeichen-Code, der die Grundsprache definiert, typischerweise in Kleinbuchstaben geschrieben. Zum Beispiel ist der Sprachcode für Englisch en, und der Code für Badeshi ist bdz.

Schrift-Subtag Optional

Dieser Subtag definiert das für die Sprache verwendete Schriftsystem und ist immer 4 Zeichen lang, wobei der erste Buchstabe großgeschrieben wird. Zum Beispiel ist Französisch in Braille fr-Brai und Japanisch, geschrieben mit dem Katakana-Alphabet, ja-Kana.

Hinweis: Wenn die Sprache in einer sehr typischen Weise geschrieben wird, wie Englisch im lateinischen Alphabet, ist es nicht notwendig, diesen Subtag zu verwenden.

Region-Subtag Optional

Dieser Subtag definiert einen Dialekt der Grundsprache aus einem bestimmten Ort und besteht entweder aus zwei Großbuchstaben, die einem Ländercode entsprechen, oder aus drei Zahlen, die einem Nicht-Länder-Bereich entsprechen. Zum Beispiel steht es-ES für Spanisch, wie es in Spanien gesprochen wird, und es-013 für Spanisch, wie es in Zentralamerika gesprochen wird. "Internationales Spanisch" wäre einfach es.

Das Schrift-Subtag geht dem Regions-Subtag voraus, wenn beide vorhanden sind — ru-Cyrl-BY ist Russisch, geschrieben im kyrillischen Alphabet, wie es in Belarus gesprochen wird.

Siehe auch