यूनिकोड

Technical/Unicode

एक सार्वभौमिक वर्ण एन्कोडिंग मानक जो इमोजी सहित सभी लेखन प्रणालियों और प्रतीक सेटों में प्रत्येक वर्ण को एक अद्वितीय संख्या प्रदान करता है।

Unicode is the foundation of modern text computing. Before Unicode, competing encoding standards (ASCII, ISO 8859, Shift JIS, etc.) made international text exchange error-prone. Unicode provides a single, consistent mapping from numbers to characters.

The standard defines over 154,000 characters spanning 168 scripts. Emoji are allocated primarily in the Supplementary Multilingual Plane (Plane 1), starting around U+1F600. The Unicode Consortium releases new versions annually, each potentially adding new emoji.

Unicode only defines *what* each code point means — the actual byte representation depends on the encoding form used (UTF-8, UTF-16, or UTF-32).

संबंधित शब्द

ICU (ICU) ICU (ICU)
International Components for Unicode — एक व्यापक रूप से उपयोग की जाने वाली ओपन-सोर्स लाइब्रेरी जो इमोजी प्रोसेसिंग सहित Unicode और अंतर्राष्ट्रीयकरण समर्थन प्रदान करती है।
Unicode मानक Unicode मानक
Unicode Consortium द्वारा बनाए रखी गई संपूर्ण वर्ण एन्कोडिंग प्रणाली, जो वर्ण, गुण, एल्गोरिदम और एन्कोडिंग रूपों को परिभाषित करती है।
इमोजी इमोजी
एक जापानी शब्द (絵文字) जिसका अर्थ है 'चित्र वर्ण' — छोटे ग्राफिकल प्रतीक जो डिजिटल संचार में विचार, भावनाएं और वस्तुएं व्यक्त करने के लिए उपयोग किए जाते हैं।
कोड पॉइंट कोड पॉइंट
Unicode मानक में प्रत्येक वर्ण को दिया गया एक अद्वितीय संख्यात्मक मान, जो U+XXXX प्रारूप में लिखा जाता है (जैसे 😀 के लिए U+1F600)।

संबंधित टूल्स

🔢 Unicode लुकअप Unicode लुकअप
U+1F600 जैसा codepoint दर्ज करें और emoji, एन्कोडिंग विवरण, UTF-8/16 बाइट्स और HTML entities प्राप्त करें।
🔍 सीक्वेंस विश्लेषक सीक्वेंस विश्लेषक
ZWJ सीक्वेंस, स्किन टोन मॉडिफ़ायर, कीकैप सीक्वेंस और फ्लैग जोड़ों को अलग-अलग घटकों में डीकोड करें।