ग्राफ़ीम क्लस्टर

Technical/Unicode

एक उपयोगकर्ता-दृश्य वर्ण जो कई Unicode कोड पॉइंट से मिलकर बना हो सकता है, लेकिन एकल दृश्य इकाई के रूप में प्रदर्शित होता है।

A grapheme cluster is what a user sees as "one character" on screen, even though it may be encoded as several code points. This concept is crucial for emoji because many emoji are composed of multiple code points.

For example, a flag emoji like 🇰🇷 is two Regional Indicator code points. A person emoji with skin tone like 👍🏽 is two code points (the gesture + a modifier). ZWJ sequences can combine even more.

Programming languages differ in how they handle grapheme clusters. JavaScript's `.length` counts UTF-16 code units, so `'👨‍👩‍👧'.length` returns 8, not 1. Proper grapheme-aware APIs (like `Intl.Segmenter`) return the expected count of 1.

संबंधित शब्द

ICU (ICU) ICU (ICU)
International Components for Unicode — एक व्यापक रूप से उपयोग की जाने वाली ओपन-सोर्स लाइब्रेरी जो इमोजी प्रोसेसिंग सहित Unicode और अंतर्राष्ट्रीयकरण समर्थन प्रदान करती है।
कोड पॉइंट कोड पॉइंट
Unicode मानक में प्रत्येक वर्ण को दिया गया एक अद्वितीय संख्यात्मक मान, जो U+XXXX प्रारूप में लिखा जाता है (जैसे 😀 के लिए U+1F600)।
ज़ीरो विड्थ जॉइनर (ZWJ) ज़ीरो विड्थ जॉइनर (ZWJ)
एक अदृश्य Unicode वर्ण (U+200D) जिसका उपयोग कई इमोजी को एक संयुक्त इमोजी में जोड़ने के लिए किया जाता है, जैसे लोगों और वस्तुओं को पेशे वाले इमोजी में संयोजित …

संबंधित टूल्स

🔍 सीक्वेंस विश्लेषक सीक्वेंस विश्लेषक
ZWJ सीक्वेंस, स्किन टोन मॉडिफ़ायर, कीकैप सीक्वेंस और फ्लैग जोड़ों को अलग-अलग घटकों में डीकोड करें।
🔢 Unicode लुकअप Unicode लुकअप
U+1F600 जैसा codepoint दर्ज करें और emoji, एन्कोडिंग विवरण, UTF-8/16 बाइट्स और HTML entities प्राप्त करें।