العروض الخاصة (كتلة Unicode) - Specials (Unicode block)

من ويكيبيديا، الموسوعة الحرة

Pin
Send
Share
Send

العروض الخاصة
نطاقU + FFF0..U + FFFF
(16 نقطة رمز)
طائرةBMP
نصوصمشترك
تعيين5 نقاط رمز
غير مستعمل9 نقاط رمز محجوزة
2 غير أحرف
تاريخ إصدار يونيكود
1.0.01 (+1)
2.12 (+1)
3.05 (+3)
ملحوظة: [1][2]

العروض الخاصة هو قصير يونيكود الكتلة المخصصة في نهاية المستوى الأساسي متعدد اللغات، في U + FFF0 – FFFF. من بين هذه النقاط الـ 16 ، تم تعيين خمس نقاط منذ Unicode 3.0:

  • U + FFF9 مرساة التعليقات التوضيحية عبر الإنترنت، علامات بداية نص مشروح
  • U + FFFA فاصل التعليقات التوضيحية الداخلية، علامات بداية حرف (أحرف) التعليق
  • U + FFFB إنهاء التوضيحات عبر الإنترنت، علامات نهاية كتلة التعليق التوضيحي
  • U + FFFC حرف استبدال الكائن، عنصر نائب في النص لكائن آخر غير محدد ، على سبيل المثال في ملف وثيقة مركبة.
  • U + FFFD حرف بديل تستخدم لاستبدال شخصية غير معروفة أو غير معروفة أو غير قابلة للتمثيل
  • U + FFFE <noncharacter-FFFE> لا شخصية.
  • U + FFFF <noncharacter-FFFF> لا شخصية.

لم يتم تحديد FFFE و FFFF بالمعنى المعتاد ، ولكن مضمون ألا تكون أحرف Unicode على الإطلاق. يمكن استخدامها لتخمين مخطط ترميز النص ، نظرًا لأن أي نص يحتوي عليها هو بحكم التعريف ليس نص Unicode مشفر بشكل صحيح. يونيكود U + FEFF BYTE ORDER MARK يمكن إدراج الحرف في بداية نص Unicode للإشارة إلى الانتماء: برنامج يقرأ مثل هذا النص ويواجه 0xFFFE سيعرف بعد ذلك أنه يجب عليه تبديل ترتيب البايت لجميع الأحرف التالية.

اسم الكتلة الخاص به في Unicode 1.0 كان مميز.[3]

شخصية الاستبدال

شخصية الاستبدال

ال شخصية الاستبدال (غالبًا ما يكون الماس الأسود مع علامة استفهام بيضاء أو مربع مربع فارغ) هو رمز موجود في يونيكود قياسي عند نقطة الرمز U + FFFD في ملف العروض الخاصة الطاولة. يتم استخدامه للإشارة إلى المشكلات عندما يكون النظام غير قادر على تقديم دفق البيانات إلى رمز صحيح. يُرى عادةً عندما تكون البيانات غير صالحة ولا تتطابق مع أي حرف:

فكر في ملف نصي يحتوي على الكلمة الألمانية فور (معنى "لـ") في ISO-8859-1 التشفير (0x66 0xFC 0x72). هذا الملف مفتوح الآن باستخدام محرر نصوص يفترض أن الإدخال هو UTF-8. البايتان الأول والأخير هما ترميزات UTF-8 صالحة لـ ASCII ، لكن البايت الأوسط (0xFC) بايت غير صالح في UTF-8. لذلك ، يمكن لمحرر النصوص استبدال هذا البايت برمز الحرف البديل لإنتاج سلسلة صالحة من Unicode نقاط الرمز. يتم عرض السلسلة بأكملها الآن على النحو التالي: "f r".

قد يحفظ محرر النصوص الذي تم تنفيذه بشكل سيئ البديل في شكل UTF-8 ؛ ستبدو بيانات الملف النصي بعد ذلك بالشكل التالي: 0x66 0xEF 0xBF 0xBD 0x72، والتي سيتم عرضها في ISO-8859-1 كـ "f�r" (وهذا ما يسمى موجيباك). نظرًا لأن الاستبدال هو نفسه بالنسبة لجميع الأخطاء ، فإن هذا يجعل من المستحيل استعادة الشخصية الأصلية. التصميم الأفضل (ولكن الأصعب في التنفيذ) هو الحفاظ على البايت الأصلي ، بما في ذلك الخطأ ، والتحويل إلى الاستبدال فقط عندما عرض النص. سيسمح ذلك لمحرر النصوص بحفظ تسلسل البايت الأصلي ، مع الاستمرار في إظهار مؤشر الخطأ للمستخدم.

في وقت ما ، تم استخدام حرف الاستبدال غالبًا عندما لا يتوفر حرف رسومي في خط لهذا الحرف. ومع ذلك ، فإن معظم أنظمة عرض النص الحديثة تستخدم الخطوط بدلاً من ذلك .notdef حرف ، وهو في معظم الحالات مربع فارغ (أو "؟" في مربع[4]) ، تسمى أحيانًا "التوفو"(يعرض هذا المستعرض"). لا توجد نقطة رمز Unicode لهذا الرمز.

وبالتالي لا يُرى الآن الحرف البديل إلا لأخطاء الترميز ، مثل UTF-8 غير صالح. تحاول بعض البرامج إخفاء ذلك عن طريق ترجمة وحدات البايت الخاصة بـ UTF-8 غير الصالحة إلى أحرف متطابقة بتنسيق نظام التشغيل Windows-1252 (نظرًا لأن هذا هو المصدر الأكثر احتمالًا لهذه الأخطاء) ، بحيث لا يتم رؤية الحرف البديل أبدًا.

مخطط يونيكود

العروض الخاصة[1][2][3]
مخطط رمز اتحاد Unicode الرسمي (بي دي إف)
 0123456789أبجدهF
U + FFFx I ل
أ
I ل
س
I ل
تي
ملاحظات
1.^ اعتبارًا من إصدار Unicode 13.0
2.^ تشير المناطق الرمادية إلى نقاط الرمز غير المعينة
3.^ تشير المناطق السوداء إلى غير أحرف (نقاط الرمز التي يضمن عدم تخصيصها أبدًا كأحرف مشفرة في معيار Unicode)

التاريخ

تسجل المستندات التالية ذات الصلة بـ Unicode الغرض وعملية تحديد أحرف معينة في كتلة Specials:

الإصدارنقاط الرمز النهائية[أ]العدالتوقيت العالمي هوية شخصيةL2 هوية شخصيةWG2 هوية شخصيةوثيقة
1.0.0U + FFFD1(يتم تحديدها)
U + FFFE..FFFF2(يتم تحديدها)
L2 / 01-295Rمور ، ليزا (2006-11-11) ، "Motion 88-M2" ، دقائق من اجتماع UTC / L2 رقم 88
L2 / 01-355N2369 (html, وثيقة)ديفيس ، مارك (2001-09-26), طلب السماح لـ FFFF و FFFE بتنسيق UTF-8 في نص ISO / IEC 10646
L2 / 02-154N2403Umamaheswaran، V. S. (2002-04-22)، "9.3 Allowing FFFF and FFFE in UTF-8" ، مشروع محضر اجتماع WG 2 41 ، فندق Phoenix ، سنغافورة ، 2001-10-15 / 19
2.1U + FFFC1UTC / 1995-056سارجنت ، موراي (6 ديسمبر 1995) ، توصية لتشفير حرف WCH_EMBEDDING
UTC / 1996-002أليبراند ، جوان ؛ هارت ، إدوين ؛ جرينفيلد ، ستيف (1996-03-05) ، "الكائنات المضمنة" ، UTC # 67 دقيقة
N1365سارجنت ، موراي (18 مارس 1996) ، ملخص الاقتراح - حرف استبدال الكائن
N1353Umamaheswaran، V.S.؛ قصر ، مايك (1996/06/25) ، "8.14" ، مسودة محضر اجتماع WG2 في كوبنهاجن رقم 30
L2 / 97-288N1603Umamaheswaran، V. S. (1997-10-24)، "7.3"، محضر الاجتماعات غير المؤكدة ، اجتماع مجموعة العمل الثانية رقم 33 ، هيراكليون ، كريت ، اليونان ، 20 يونيو - 4 يوليو 1997
L2 / 98-004RN1681نص ISO 10646 - AMD 18 لتسجيل PDAM واقتراع FPDAM, 1997-12-22
L2 / 98-070أليبراند ، جوان ؛ أرنولد وينكلر ، "تعليقات إضافية بخصوص 2.1" ، محضر اجتماع UTC و L2 المشترك من الاجتماع في كوبرتينو ، 25-27 فبراير 1998
L2 / 98-318N1894نص منقح من 10646-1 / FPDAM 18 ، تعديل 18: الرموز وغيرها, 1998-10-22
3.0U + FFF9..FFFB3L2 / 97-255RAliprand ، Joan (1997-12-03) ، "3.D Proposal for In-Line Notation (ruby)" ، الدقائق المعتمدة - الاجتماع المشترك UTC # 73 & L2 # 170 ، بالو ألتو ، كاليفورنيا - 4-5 أغسطس ، 1997
L2 / 98-055فريتاغ ، أسموس (22 فبراير 1998) ، دعم تنفيذ التعليقات التوضيحية المضمنة والداخلية
L2 / 98-070أليبراند ، جوان ؛ Winkler ، Arnold ، "3.C.5. دعم تنفيذ التعليقات التوضيحية المضمّنة والبينية" ، محضر اجتماع UTC و L2 المشترك من الاجتماع في كوبرتينو ، 25-27 فبراير 1998
L2 / 98-099N1727فريتاغ ، أسموس (18 مارس 1998) ، دعم تنفيذ التعليقات التوضيحية بين الخطوط كما هو مستخدم في طباعة شرق آسيا
L2 / 98-158أليبراند ، جوان ؛ أرنولد وينكلر (1998-05-26) ، "التعليقات التوضيحية المضمّنة والبينية" ، مسودة المحضر - الاجتماع المشترك UTC # 76 & NCITS Subgroup L2 # 173 المشترك ، Tredyffrin ، Pennsylvania ، 20-22 أبريل 1998
L2 / 98-286N1703Umamaheswaran، V.S.؛ قصر ، مايك (1998/07/02) ، "8.14" ، محضر اجتماع غير مؤكد ، اجتماع مجموعة العمل 2 رقم 34 ، ريدموند ، واشنطن ، الولايات المتحدة الأمريكية ؛ 1998-03-16–20
L2 / 98-270هيورا ، هيديكي ؛ كوباياشي ، تاتسو (1998-07-29), اقتراح لمقترح التعليق التوضيحي المضمن وبين السطور
L2 / 98-281R (pdf, لغة البرمجة)أليبراند ، جوان (31 يوليو 1998) ، "شرح توضيحي في السطر وبيني (III.C.1.c)" ، الدقائق غير المؤكدة - UTC # 77 & NCITS Subgroup L2 # 174 JOINT MEETING ، Redmond ، WA - 29-31 يوليو ، 1998
L2 / 98-363N1861ساتو ، تي ك. (1998-09-01) ، علامات روبي
L2 / 98-372N1884R2 (pdf, وثيقة)ويسلر ، كين ؛ وآخرون. (1998-09-22) ، أحرف إضافية لـ UCS
L2 / 98-416N1882.zipدعم تنفيذ التعليقات التوضيحية بين الخطوط, 1998-09-23
L2 / 98-329N1920تسجيل PDAM المشترك والاقتراع في الاعتبار على WD لـ ISO / IEC 10646-1 / Amd. 30 ، التعديل 30: شخصيات لاتينية إضافية وشخصيات أخرى, 1998-10-28
L2 / 98-421Rسوينارد ، ميشيل ؛ هيورا ، هيديكي (1998-12-04) ، ملاحظات تتعلق بأحرف التعليق التوضيحي بين السطور PDAM 30
L2 / 99-010N1903 (pdf, لغة البرمجة, وثيقة)Umamaheswaran، V. S. (1998-12-30)، "8.2.15"، محضر اجتماع مجموعة العمل 2 رقم 35 ، لندن ، المملكة المتحدة ؛ 1998-09-21-25
L2 / 98-419 (pdf, وثيقة)أليبراند ، جوان (5 فبراير 1999) ، "أحرف التعليقات التوضيحية البينية" ، الدقائق المعتمدة - UTC # 78 & NCITS Subgroup L2 # 175 الاجتماع المشترك ، سان خوسيه ، كاليفورنيا - 1-4 ديسمبر 1998
UTC / 1999-021دورست ، مارتن ؛ بوساك ، جون (1999-06-08), بيان W3C XML CG على أحرف التعليقات التوضيحية
L2 / 99-176Rمور ، ليزا (1999-11-04) ، "بيان اتصال W3C حول شخصيات التعليقات التوضيحية" ، محضر اجتماع UTC / L2 المشترك في سياتل ، 8-10 يونيو 1999
L2 / 01-301Whistler ، Ken (2001-08-01) ، "E. يشار إلى أنه" غير مستحسن بشدة "لتبادل النص العادي" ، تحليل إهمال الحرف في معيار Unicode
  1. ^ قد تختلف أسماء نقاط الرموز والأحرف المقترحة عن أسماء نقاط الشفرة النهائية والأسماء

أنظر أيضا

المراجع

  1. ^ "قاعدة بيانات أحرف Unicode". معيار يونيكود. تم الاسترجاع 2016-07-09.
  2. ^ "الإصدارات المعدودة من معيار Unicode". معيار يونيكود. تم الاسترجاع 2016-07-09.
  3. ^ 3.8: مخططات بلوك بلوك (بي دي إف). معيار يونيكود. الإصدار 1.0. اتحاد يونيكود.
  4. ^ "توصيات لخطوط OpenType (OpenType 1.7) - أسلوب الطباعة". docs.microsoft.com. تم الاسترجاع 18 أكتوبر 2020.

Pin
Send
Share
Send