ISO 639-3 - ISO 639-3

من ويكيبيديا، الموسوعة الحرة

Pin
Send
Share
Send

ISO 639-3: 2007, رموز تمثيل أسماء اللغات - الجزء 3: كود Alpha-3 لتغطية شاملة للغات، هو معيار دولي لـ رموز اللغة في ال ISO 639 سلسلة. يحدد أكواد من ثلاثة أحرف لتحديد اللغات. تم نشر المعيار بواسطة المنظمة الدولية للمقاييس (ISO) في 1 فبراير 2007.[1]

يوسع ISO 639-3 امتداد ISO 639-2 أكواد alpha-3 بهدف تغطية كل ما هو معروف اللغات الطبيعية. استندت التغطية اللغوية الموسعة في المقام الأول على أكواد اللغة المستخدمة في إثنولوج (المجلدات 10-14) التي نشرتها SIL الدولية، والذي أصبح الآن سلطة التسجيل لـ ISO 639-3.[2] يوفر تعدادًا كاملاً للغات قدر الإمكان ، بما في ذلك اللغات الحية والمنقرضة ، القديمة والمنشأة ، الرئيسية والثانوية ، المكتوبة وغير المكتوبة.[1] ومع ذلك ، فإنه لا يشمل لغات أعيد بناؤها مثل بروتو الهندو أوروبية.[3]

ISO 639-3 مخصص للاستخدام كملف البيانات الوصفية رموز في مجموعة واسعة من التطبيقات. يستخدم على نطاق واسع في أنظمة الكمبيوتر والمعلومات ، مثل الإنترنت ، حيث تحتاج العديد من اللغات إلى الدعم. في المحفوظات وتخزين المعلومات الأخرى ، يتم استخدامه في أنظمة الفهرسة ، مما يشير إلى اللغة التي يوجد بها المورد أو حولها. تُستخدم الرموز أيضًا بشكل متكرر في الأدبيات اللغوية وأماكن أخرى للتعويض عن حقيقة أن أسماء اللغات قد تكون غامضة أو غامضة.

ابحث عن لغة
أدخل رمز ISO 639-3 للعثور على مقالة اللغة المقابلة.

رموز اللغة

يتضمن ISO 639-3 جميع اللغات بتنسيق ISO 639-1 وجميع اللغات الفردية في ISO 639-2. ركز كل من ISO 639-1 و ISO 639-2 على اللغات الرئيسية ، والتي يتم تمثيلها بشكل متكرر في مجموع الأدبيات العالمية. نظرًا لأن ISO 639-2 يتضمن أيضًا مجموعات اللغات ولا يتضمن الجزء 3 ، فإن ISO 639-3 ليس مجموعة شاملة من ISO 639-2. أين رموز B و T. موجودة في ISO 639-2 ، تستخدم ISO 639-3 رموز T.

مثال على رموز لغة ISO
لغة639-1639-2 (B / T)639-3 نوع639-3 كود
الإنجليزيةenمفردم
ألمانيةديجير / ديوفردديو
عربىأرآرادقيقآرا
فردعرب + آخرين
صينىzhتشي / جو[4][5]دقيقزهو
الماندرينفردسمن
الكانتونيةفرديو
مينانفردنان

اعتبارًا من 30 يناير 2020، يحتوي المعيار على 7868 إدخالاً.[6] يعتمد جرد اللغات على عدد من المصادر بما في ذلك: اللغات الفردية الواردة في 639-2 ، واللغات الحديثة من إثنولوجوالأصناف التاريخية واللغات القديمة و لغات اصطناعية من قائمة اللغويين,[7] بالإضافة إلى اللغات الموصى بها خلال فترة التعليق العام السنوية.

البيانات المقروءة آليًا يتم توفير الملفات من قبل سلطة التسجيل.[6] يمكن إجراء التعيينات من ISO 639-1 أو ISO 639-2 إلى ISO 639-3 باستخدام ملفات البيانات هذه.

تهدف المواصفة القياسية ISO 639-3 إلى افتراض الفروق بناءً على معايير ليست ذاتية بالكامل.[8] لا يُقصد به توثيق أو توفير معرّفات للهجات أو الاختلافات اللغوية الفرعية الأخرى.[9] ومع ذلك ، فإن الأحكام المتعلقة بالتمييز بين اللغات قد تكون ذاتية ، لا سيما في حالة تنوع اللغة دون التقاليد الأدبية الراسخة ، أو الاستخدام في التعليم أو الإعلام ، أو العوامل الأخرى التي تساهم في تقليد اللغة. لذلك ، لا ينبغي اعتبار المعيار بيانًا رسميًا لماهية اللغات المميزة الموجودة في العالم (والتي قد يكون هناك اختلاف كبير حولها في بعض الحالات) ، بل بالأحرى طريقة مفيدة واحدة لتحديد أنواع اللغات المختلفة بدقة.

مساحة الرمز

نظرًا لأن الرمز أبجدي من ثلاثة أحرف ، فإن الحد الأعلى لعدد اللغات التي يمكن تمثيلها هو 26 × 26 × 26 = 17،576. نظرًا لأن ISO 639-2 يحدد الرموز الخاصة (4) ، ونطاق محجوز (520) ورموز B فقط (22) ، فلا يمكن استخدام 546 رمزًا في الجزء 3. لذلك ، فإن الحد الأعلى الأكثر صرامة هو 17،576 - 546 = 17،030.

يصبح الحد الأعلى أكثر صرامة إذا طرح المرء مجموعات اللغة المحددة في 639-2 والمجموعات التي لم يتم تحديدها بعد في ISO 639-5.

Macrolanguages

هناك 58 لغة في ISO 639-2 والتي تعتبر ، لأغراض المعيار ، "لغات ماكرو" في ISO 639-3.[10]

بعض هؤلاء اللغات الكبرى ليس لها لغة فردية على النحو المحدد في ISO 639-3 في مجموعة الرموز ISO 639-2 ، على سبيل المثال 'ara' (العربية العامة). البعض الآخر مثل "ولا" (النرويجية) كان لها جزئين منفصلين ("nno" (نينورسك) ، "لا" (بوكمال)) موجود بالفعل في ISO 639-2.

وهذا يعني أن بعض اللغات (مثل "arb" و "العربية الفصحى") التي اعتبرتها ISO 639-2 لهجات من لغة واحدة ("ara") هي الآن في ISO 639-3 في سياقات معينة تعتبر لغات فردية بحد ذاتها.

هذه محاولة للتعامل مع الأصناف التي قد تكون مختلفة لغويًا عن بعضها البعض ، ولكن يتم التعامل معها من قبل المتحدثين على أنها شكلين من نفس اللغة ، على سبيل المثال في حالات ازدواج اللسان.

فمثلا:

نرى[11] للحصول على القائمة الكاملة.

اللغات الجماعية

"عنصر رمز اللغة الجماعي هو معرف يمثل مجموعة من اللغات الفردية التي لا تعتبر لغة واحدة في أي سياق استخدام."[12] هذه الرموز لا تمثل بدقة لغة معينة أو لغة كبيرة.

بينما يتضمن ISO 639-2 معرفات من ثلاثة أحرف للغات الجماعية ، يتم استبعاد هذه الرموز من ISO 639-3. ومن ثم ، فإن ISO 639-3 ليس مجموعة شاملة من ISO 639-2.

ISO 639-5 يحدد الرموز الجماعية المكونة من 3 أحرف للعائلات والمجموعات اللغوية ، بما في ذلك رموز اللغة الجماعية من ISO 639-2.

رموز خاصة

يتم وضع أربعة رموز جانباً في ISO 639-2 و ISO 639-3 للحالات التي لا يكون فيها أي من الرموز المحددة مناسبًا. هذه مخصصة في المقام الأول لتطبيقات مثل قواعد البيانات التي تتطلب رمز ISO بغض النظر عن وجودها.

  • سوء (اللغات غير المشفرة ، في الأصل اختصار لـ "متنوع") مخصص للغات التي لم يتم تضمينها (حتى الآن) في معيار ISO.
  • مول (لغات متعددة) مخصص للحالات التي تتضمن فيها البيانات أكثر من لغة واحدة ، و (على سبيل المثال) تتطلب قاعدة البيانات رمز ISO واحد.
  • اوند (غير محدد) مخصص للحالات التي لم يتم فيها تحديد اللغة الموجودة في البيانات ، على سبيل المثال عندما تكون التسمية خاطئة أو لم يتم تصنيفها مطلقًا. ليس المقصود لحالات مثل حصان طروادة حيث تم إعطاء اسم للغة غير مصدقة.
  • zxx (لا يوجد محتوى لغوي / غير قابل للتطبيق) مخصص للبيانات التي ليست لغة على الإطلاق ، مثل مكالمات الحيوانات.[13]

بالإضافة إلى ذلك ، 520 رمزًا في النطاق qaaqtz هي "محجوزة للاستخدام المحلي". على سبيل المثال ، ملف قائمة اللغويين يستخدمهم ل اللغات المنقرضة. قامت قائمة Linguist List بتعيين قيمة عامة لأحدها: qnp، لغة أولية غير مسماة. يستخدم هذا للعقد الوسيطة المقترحة في شجرة العائلة التي ليس لها اسم.

عمليات الصيانة

جدول الكود الخاص بـ ISO 639-3 مفتوح للتغييرات. من أجل حماية استقرار الاستخدام الحالي ، تقتصر التغييرات المسموح بها على:[14]

  • تعديلات على المعلومات المرجعية لإدخال (بما في ذلك الأسماء أو التصنيفات الخاصة بالنوع والنطاق) ،
  • إضافة إدخالات جديدة ،
  • إهمال الإدخالات المكررة أو الزائفة ،
  • دمج إدخال واحد أو أكثر في إدخال آخر ، و
  • تقسيم إدخال لغة موجود إلى عدة إدخالات لغة جديدة.

لا يتم تغيير الكود المخصص للغة ما لم يكن هناك أيضًا تغيير في التسمية.[15]

يتم إجراء التغييرات على دورة سنوية. يتم منح كل طلب فترة لا تقل عن ثلاثة أشهر للمراجعة العامة.

يحتوي موقع الويب ISO 639-3 على صفحات تصف "نطاقات الدلالة"[16] (ضعيف أنواع) وأنواع اللغات ،[17] التي تشرح المفاهيم الموجودة في نطاق التشفير ومعايير معينة يجب الوفاء بها. على سبيل المثال ، يمكن ترميز اللغات المُنشأة ، ولكن فقط إذا كانت مصممة للتواصل البشري ولديها مجموعة من الأدبيات ، مما يمنع طلبات الاختراعات الخاصة.

توثق سلطة التسجيل على موقع الويب الخاص بها الإرشادات الواردة في نص معيار ISO 639-3 فيما يتعلق بكيفية الحفاظ على جداول الرموز.[18] كما يوثق العمليات المستخدمة لتلقي طلبات التغيير ومعالجتها.[19]

يتم توفير نموذج طلب التغيير ، وهناك نموذج آخر لجمع المعلومات حول الإضافات المقترحة. يمكن لأي طرف تقديم طلبات التغيير. عند تقديمها ، تتم مراجعة الطلبات في البداية من قبل سلطة التسجيل للتأكد من اكتمالها.

عند استلام طلب موثق بالكامل ، تتم إضافته إلى فهرس طلب التغيير المنشور. أيضًا ، يتم إرسال الإعلانات إلى قائمة مناقشة LINGUIST العامة في Linguist List والقوائم الأخرى التي قد تراها سلطة التسجيل ذات صلة ، وتدعو الجمهور إلى المراجعة والمدخلات بشأن التغيير المطلوب. يستطيع أي مالك أو فرد للقائمة طلب إخطارات بطلبات التغيير لمناطق أو مجموعات لغوية معينة. يتم نشر التعليقات التي يتم تلقيها للأطراف الأخرى لمراجعتها. بناءً على الإجماع في التعليقات الواردة ، قد يتم سحب طلب التغيير أو ترقيته إلى "حالة المرشح".

قبل ثلاثة أشهر من نهاية دورة المراجعة السنوية (عادةً في سبتمبر) ، يتم تعيين إعلان على قائمة مناقشة LINGUIST والقوائم الأخرى المتعلقة بطلبات تغيير حالة المرشح. تظل جميع الطلبات مفتوحة للمراجعة والتعليق حتى نهاية دورة المراجعة السنوية.

يتم الإعلان عن القرارات في نهاية دورة المراجعة السنوية (عادةً في يناير). في ذلك الوقت ، يمكن اعتماد الطلبات كليًا أو جزئيًا ، وتعديلها وترحيلها إلى دورة المراجعة التالية ، أو رفضها. غالبًا ما تتضمن حالات الرفض اقتراحات حول كيفية تعديل المقترحات لإعادة التقديم. يتم الاحتفاظ بأرشيف عام لكل طلب تغيير جنبًا إلى جنب مع القرارات المتخذة والأسباب المنطقية للقرارات.[20]

نقد

يثير اللغويون موري وبوست وفريدمان انتقادات مختلفة لـ ISO 639 ، ولا سيما ISO 639-3:[15]

  • تعتبر الرموز المكونة من ثلاثة أحرف بحد ذاتها مشكلة ، لأنه في حين أن التسميات الفنية التعسفية رسميًا ، فإنها غالبًا ما يتم اشتقاقها من الاختصارات التذكر لأسماء اللغات ، وبعضها تحقير. فمثلا، يمسا تم تعيين الرمز jnj، من "جينجيرو" التحقيرية. وبالتالي ، يمكن اعتبار هذه الرموز مسيئة من قبل المتحدثين الأصليين ، ولكن الرموز في المعيار ، بمجرد تعيينها ، لا يمكن تغييرها.
  • تعد إدارة المعيار إشكالية لأن SIL هي منظمة تبشيرية مع عدم كفاية الشفافية والمساءلة. يتم اتخاذ القرارات المتعلقة بما يستحق أن يتم ترميزه كلغة داخليًا. في حين أن المدخلات الخارجية قد تكون أو لا تكون موضع ترحيب ، فإن القرارات نفسها غير شفافة ، وقد تخلى العديد من اللغويين عن محاولة تحسين المعيار.
  • التعريف الدائم للغة غير متوافق مع تغيير اللغة.
  • غالبًا لا يمكن تمييز اللغات واللهجات بدقة ، و استمرار اللهجة يمكن تقسيمها إلى أقسام فرعية بعدة طرق ، بينما تمنح الامتيازات القياسية خيارًا واحدًا. غالبًا ما تستند هذه الفروق إلى عوامل اجتماعية وسياسية.
  • قد يساء فهم المعيار ISO 639-3 وإساءة استخدامه من قبل السلطات التي تتخذ قرارات بشأن هوية الأشخاص ولغتهم ، مما يلغي حق المتحدثين في التعرف على تنوع كلامهم أو التعرف عليه. على الرغم من أن SIL حساسة لمثل هذه المشكلات ، إلا أن هذه المشكلة متأصلة في طبيعة المعيار المعمول به ، والذي يمكن استخدامه (أو إساءة استخدامه) بطرق لا يقصدها ISO و SIL.

مارتن هاسبيلماث يوافق على أربع من هذه النقاط ، لكنه لا يوافق على النقطة المتعلقة بتغيير اللغة.[21] إنه يختلف لأن أي حساب للغة يتطلب تحديده ، ويمكننا بسهولة تحديد المراحل المختلفة للغة. يقترح أن اللغويين قد يفضلون استخدام التدوين الذي تم إجراؤه في ضعيف المستوى لأنه "نادرًا ما يهم اللغويين ما إذا كان ما يتحدثون عنه هو لغة أو لهجة أو عائلة مترابطة من اللغات." يتساءل أيضًا عما إذا كان معيار ISO لتحديد اللغة مناسبًا لأن ISO هي منظمة صناعية ، بينما ينظر إلى توثيق اللغة والتسميات كمسعى علمي. وهو يستشهد بالحاجة الأصلية لمعرّفات اللغة المعيارية باعتبارها "الأهمية الاقتصادية للترجمة و توطين البرامج، "التي من أجلها تم وضع معايير ISO 639-1 و 639-2. لكنه يثير الشكوك حول حاجة الصناعة للتغطية الشاملة التي توفرها ISO 639-3 ، بما في ذلك" اللغات غير المعروفة للمجتمعات الصغيرة التي لم تُستخدم أبدًا في الكتابة أو نادرًا ما تكون عرضة لخطر الانقراض ".

إستعمال

  • إثنولوج
  • قائمة اللغويين
  • OLAC: مجتمع أرشيف اللغات المفتوحة[22]
  • مايكروسوفت ويندوز 8:[23] يدعم جميع الأكواد الموجودة في ISO 639-3 وقت الإصدار.
  • مؤسسة ويكيميديا: يجب أن يكون للمشاريع الجديدة القائمة على اللغة (على سبيل المثال ويكيبيديا بلغات جديدة) معرّف من ISO 639-1 أو -2 أو -3.[24]
  • معايير أخرى تعتمد على ISO 639-3:

المراجع

  1. ^ أ ب "حالة ISO 639-3 وملخص". iso.org. 2010-07-20. تم الاسترجاع 2012-06-14.
  2. ^ "وكالات الصيانة وسلطات التسجيل". ISO.
  3. ^ "أنواع اللغات الفردية - اللغات القديمة". sil.org. تم الاسترجاع 2018-06-11.
  4. ^ تقرير Ethnologue لرمز ISO 639: zho مؤرشف 2014/09/12 الساعة آلة Wayback على Ethologue.com
  5. ^ ISO639-3 على SIL.org
  6. ^ أ ب "مجموعة رموز ISO 639-3". Sil.org. 2007-10-18. تم الاسترجاع 2012-06-14.
  7. ^ "ISO 639-3". sil.org.
  8. ^ "نطاق الدلالة: اللغات الفردية". sil.org.
  9. ^ "نطاق الدلالة: اللهجات". sil.org.
  10. ^ "نطاق الدلالة: Macrolanguages". sil.org. تم الاسترجاع 2012-06-14.
  11. ^ "تعيينات Macrolanguage". sil.org. تم الاسترجاع 2012-06-14.
  12. ^ "نطاق الدلالة: اللغات الجماعية". sil.org. تم الاسترجاع 2012-06-14.
  13. ^ التسجيلات الميدانية لمكالمات Vervet Monkey. الإدخال في كتالوج اتحاد البيانات اللغوية. تم الاسترجاع 2012-09-04.
  14. ^ "إرسال طلبات التغيير ISO 639-3: أنواع التغييرات". sil.org.
  15. ^ أ ب موري ، ستيفن ؛ بوست ، مارك دبليو. فريدمان ، فيكتور أ. (2013). رموز اللغة الخاصة بالمعيار ISO 639: توحيد قياسي سابق لأوانه ، ولا يمكن الحصول عليه في النهاية ، وربما يضر. مؤتمر PARADISEC RRR. مؤرشف من الأصلي في 23 فبراير 2016. تم الاسترجاع 2015-11-03.
  16. ^ "نطاق الدلالة لمعرفات اللغة". sil.org.
  17. ^ "أنواع اللغات". sil.org.
  18. ^ "إدارة التغيير ISO 639-3". sil.org.
  19. ^ "إرسال طلبات التغيير ISO 639-3". sil.org.
  20. ^ "مؤشر طلب التغيير ISO 639-3". sil.org.
  21. ^ مارتن هاسبيلماث ، "هل يمكن توحيد هوية اللغة؟ في نقد موري وآخرون لمعيار ISO 639-3", تعليق اللغويات المتنوعة, 2013/12/04
  22. ^ "ملحق لغة OLAC". language-archives.org. تم الاسترجاع 3 أغسطس 2015.
  23. ^ "أكثر من 7000 لغة ، Windows 1 فقط". مايكروسوفت. 2014/02/05.
  24. ^ "سياسة اقتراح اللغة". wikimedia.org. تم الاسترجاع 3 أغسطس 2015.
  25. ^ "BCP 47 - علامات لتحديد اللغات". ietf.org. تم الاسترجاع 3 أغسطس 2015.
  26. ^ أ ب "منشورات EPUB 3.0". idpf.org. تم الاسترجاع 3 أغسطس 2015.
  27. ^ "شروط بيانات تعريف DCMI". purl.org. تم الاسترجاع 3 أغسطس 2015.
  28. ^ "رموز لغة ISO المكونة من حرفين أو ثلاثة أحرف". w3.org. تم الاسترجاع 3 أغسطس 2015.
  29. ^ "تسجيل اللغة". Iana.org. تم الاسترجاع 2015-08-12.
  30. ^ "3 دلالات وبنية وواجهات برمجة تطبيقات لمستندات HTML - HTML5". w3.org. تم الاسترجاع 3 أغسطس 2015.
  31. ^ "العناصر - إرشادات مستخدم MODS: مخطط وصف كائن البيانات الوصفية: MODS (مكتبة الكونغرس)". loc.gov. تم الاسترجاع 3 أغسطس 2015.
  32. ^ "لغة عنصر TEI". tei-c.org. تم الاسترجاع 3 أغسطس 2015.

قراءة متعمقة

روابط خارجية

Pin
Send
Share
Send