Unicode

Technical/Unicode

Standard universel d'encodage des caractères qui attribue un numéro unique à chaque caractère de tous les systèmes d'écriture et ensembles de symboles, y compris les emoji.

Unicode is the foundation of modern text computing. Before Unicode, competing encoding standards (ASCII, ISO 8859, Shift JIS, etc.) made international text exchange error-prone. Unicode provides a single, consistent mapping from numbers to characters.

The standard defines over 154,000 characters spanning 168 scripts. Emoji are allocated primarily in the Supplementary Multilingual Plane (Plane 1), starting around U+1F600. The Unicode Consortium releases new versions annually, each potentially adding new emoji.

Unicode only defines *what* each code point means — the actual byte representation depends on the encoding form used (UTF-8, UTF-16, or UTF-32).

Termes associés

Emoji Emoji
Mot japonais (絵文字) signifiant 'caractère image' — petits symboles graphiques utilisés dans la communication numérique pour exprimer des idées, des émotions et des objets.
ICU (ICU) ICU (ICU)
International Components for Unicode — une bibliothèque open-source très répandue offrant un support Unicode et d'internationalisation, y compris le traitement des emoji.
Norme Unicode Norme Unicode
Le système complet d'encodage des caractères maintenu par le Consortium Unicode, définissant les caractères, leurs propriétés, les algorithmes et les formes d'encodage.
Point de code Point de code
Valeur numérique unique attribuée à chaque caractère dans la norme Unicode, écrite au format U+XXXX (par exemple, U+1F600 pour 😀).

Outils associés

🔢 Recherche Unicode Recherche Unicode
Saisissez un point de code comme U+1F600 et obtenez l'emoji, les détails d'encodage, les octets UTF-8/16 et les entités HTML.
🔍 Analyseur de séquences Analyseur de séquences
Décodez les séquences ZWJ, les modificateurs de teinte de peau, les séquences de touches et les paires de drapeaux en composants individuels.