ยูนิโค้ด

Technical/Unicode

มาตรฐานการเข้ารหัสอักขระสากลที่กำหนดหมายเลขเฉพาะให้กับอักขระทุกตัวในทุกระบบการเขียนและชุดสัญลักษณ์ รวมถึงอิโมจิ

Unicode is the foundation of modern text computing. Before Unicode, competing encoding standards (ASCII, ISO 8859, Shift JIS, etc.) made international text exchange error-prone. Unicode provides a single, consistent mapping from numbers to characters.

The standard defines over 154,000 characters spanning 168 scripts. Emoji are allocated primarily in the Supplementary Multilingual Plane (Plane 1), starting around U+1F600. The Unicode Consortium releases new versions annually, each potentially adding new emoji.

Unicode only defines *what* each code point means — the actual byte representation depends on the encoding form used (UTF-8, UTF-16, or UTF-32).

คำที่เกี่ยวข้อง

ICU (ICU) ICU (ICU)
International Components for Unicode — ไลบรารีโอเพนซอร์สที่ใช้กันอย่างแพร่หลาย ให้การสนับสนุน Unicode และการนานาชาติ รวมถึงการประมวลผลอิโมจิ
โค้ดพอยท์ โค้ดพอยท์
ค่าตัวเลขเฉพาะที่กำหนดให้กับอักขระแต่ละตัวในมาตรฐาน Unicode เขียนในรูปแบบ U+XXXX (เช่น U+1F600 สำหรับ 😀)
มาตรฐาน Unicode มาตรฐาน Unicode
ระบบเข้ารหัสอักขระฉบับสมบูรณ์ที่ดูแลโดย Unicode Consortium กำหนดอักขระ คุณสมบัติ อัลกอริทึม และรูปแบบการเข้ารหัส
อิโมจิ อิโมจิ
คำภาษาญี่ปุ่น (絵文字) แปลว่า 'อักขระภาพ' — สัญลักษณ์กราฟิกขนาดเล็กที่ใช้ในการสื่อสารดิจิทัลเพื่อแสดงความคิด อารมณ์ และวัตถุ

เครื่องมือที่เกี่ยวข้อง

🔢 ค้นหา Unicode ค้นหา Unicode
ป้อนจุดรหัสเช่น U+1F600 และรับ emoji, รายละเอียดการเข้ารหัส, ไบต์ UTF-8/16 และ HTML entities
🔍 ตัววิเคราะห์ลำดับ ตัววิเคราะห์ลำดับ
ถอดรหัสลำดับ ZWJ, ตัวปรับแต่งสีผิว, ลำดับ keycap และคู่ธงเป็นส่วนประกอบแต่ละชิ้น