دو عدد بین صفر تا 65535 وارد کنید تا بتوانید کاراکترهای یونیکد و کدهای اچ.تی.ام.ال. و پایتون آنها را مشاهده کنید.
| کاراکتر | کد اچ.تی.ام.ال | کد پایتون |
|---|
یونیکد (Unicode) یک استاندارد جهانی برای نمایش و کدنویسی متن است. هدف اصلی آن این است که همهی نویسهها (character)های مورد استفاده در زبانهای مختلف دنیا ــ از جمله حروف الفبا، اعداد، علائم نگارشی، نشانههای ریاضی، ایموجیها و حتی کاراکترهای کنترلی ــ در یک سیستم واحد و قابل فهم برای رایانهها ذخیره و منتقل شوند.
🔹 نکات مهم درباره یونیکد:
-
هر نویسه در یونیکد یک کُدپوینت (Code Point) یکتا دارد؛ مثلاً:
- حرف A در الفبای لاتین: ⟵
U+0041 - حرف ب در الفبای فارسی: ⟵
U+0628 - ایموجی 🙂 ⟵
U+1F642
- حرف A در الفبای لاتین: ⟵
- یونیکد از سیستمهای کدگذاری مختلف پشتیبانی میکند تا این کُدپوینتها در حافظه ذخیره شوند؛ معروفترینشان UTF-8، UTF-16 و UTF-32 هستند.
- به کمک یونیکد میتوان یک متن را در هر زبانی (فارسی، چینی، انگلیسی، عربی، هندی، ...) روی هر رایانه یا دستگاهی نمایش داد، بدون اینکه وابسته به فونت یا کدگذاری قدیمی باشد.
🔸 پیش از یونیکد:
استانداردهای محلی مثل ASCII یا ISO-8859 فقط بخشی از نویسهها را پوشش میدادند و باعث مشکلاتی مثل ناخوانا شدن متنها (garbled text) در سیستمهای مختلف میشد.