شرح مفهوم مُحدد الموارد الموحد (URL)
June 25, 2023 * تيتو 4 تك
محدد موقع الموارد الموحد (URL) هو مرجع لمورد يحدد موقع المورد على شبكة الكمبيوتر وآلية لاسترجاعه. وعنوان URL هو نوع محدد من معرفات الموارد الموحدة (URI)، على الرغم من أن العديد من الأشخاص يستخدمون المصطلحين بالتبادل. يشير عنوان URL إلى وسيلة الوصول إلى مورد مُشار إليه، وهو أمر لا ينطبق على كل URI. تحدث عناوين URL بشكل شائع للإشارة إلى صفحات الويب (HTTP)، ولكنها تُستخدم أيضًا لنقل الملفات (ftp) والبريد الإلكتروني (Mailto) والوصول إلى قاعدة البيانات (JDBC) والعديد من التطبيقات الأخرى.
تعرض معظم متصفحات الويب عنوان URL لصفحة الويب أعلى الصفحة في شريط العناوين. يحتوي عنوان URL النموذجي على الشكل http://www.example.com/index.html، مما يشير إلى نوع البروتوكول (HTTP) واسم المجال (www.example.com) وصفحة الويب المحددة (index.html).
تاريخ نشأة مُحدد الموارد الموحد (URL)
تم توحيد محدد موقع الموارد الموحد في عام 1994 من قبل Tim Berners-Lee ومجموعة عمل URI التابعة لفريق عمل هندسة الإنترنت (IETF) كنتيجة للتعاون الذي بدأ في جلسة IETF Living Documents "Birds of a Feather" في عام 1992. التنسيق يجمع بين النظام الموجود مسبقًا لأسماء النطاقات (الذي تم إنشاؤه في عام 1985) مع بناء جملة مسار الملف، حيث تُستخدم الخطوط المائلة لفصل أسماء الدلائل والملفات. كانت الاصطلاحات موجودة بالفعل حيث يمكن إضافة أسماء الخوادم مسبقًا لإكمال مسارات الملفات، مسبوقة بشرطة مائلة مزدوجة (//).
أعرب Berners-Lee لاحقًا عن أسفه على استخدام النقاط لفصل أجزاء اسم المجال داخل URIs، متمنيًا أن يكون قد استخدم الخطوط المائلة طوال الوقت. على سبيل المثال، ربما تمت كتابة http: //www.example.com/path/to/name إلى http: com / example / www / path / to / name. قال Berners-Lee أيضًا أنه بالنظر إلى مخطط URI، فإن الشرطتين المائلتين قبل اسم المجال غير ضروريين أيضًا.
بناء جملة مُحدد الموارد الموحد (URL)
يتكون كل عنوان URL لـ HTTP مما يلي، بالترتيب المحدد. تشترك العديد من الأنظمة بخلاف HTTP أيضًا في هذا التنسيق العام، مع بعض الاختلاف:
1. اسم المخطط (يُسمى عادةً البروتوكول، على الرغم من أن كل مخطط عنوان URL ليس بروتوكولًا، على سبيل المثال، Mailto ليس بروتوكولًا).
2. نقطتان، ثم شرطتان مائلتان.
3. المضيف، يُعطى عادةً كاسم مجال على سبيل المثال، كان من الممكن تغيير كتابة http://www.example.com/path/to/name إلى http: com / example / www / path / to / name، ولكن في بعض الأحيان كعنوان IP حرفي.
4. علامة نقطتين متبوعة برقم منفذ (اختياريًا).
5. المسار الكامل للمورد.
يوضح المخطط كيفية الاتصال، ويحدد المضيف مكان الاتصال، ويحدد الباقي ما يجب طلبه. بالنسبة للبرامج مثل البرامج النصية لواجهة البوابة العامة (CGI)، يتبع ذلك سلسلة استعلام ومعرف جزء اختياري. وتكون الصيغة هي:
scheme://[user:password@]domain:port/path?query_string#fragment_id
تفاصيل المكون:
- يحدد المخطط ، الذي يكون في كثير من الحالات اسم بروتوكول (ولكن ليس دائمًا) ، كيفية الحصول على المورد. تتضمن الأمثلة http و https و ftp و file وغيرها الكثير. على الرغم من أن المخططات غير حساسة لحالة الأحرف ، إلا أن الشكل الأساسي هو أحرف صغيرة.
- يعطي اسم المجال أو عنوان IP الرقمي الحرفي موقع الوجهة لعنوان URL. قد يتم إعطاء عنوان IPv6 رقمي ، ولكن يجب أن يتم تضمينه في [ ] على سبيل المثال [db8: 0cec :: 99: 123a].النطاق google.com ، أو عنوان IP الرقمي الخاص به 173.194.34.5 ، هو عنوان موقع Google على الويب.
- جزء اسم المجال لعنوان URL ليس حساسًا لحالة الأحرف نظرًا لأن DNS يتجاهل الحالة:/http://en.example.org و /HTTP://EN.EXAMPLE.ORG يفتح كلاهما نفس الصفحة.
- رقم المنفذ ، المعطى في النظام العشري ، اختياري ؛ إذا تم حذفه ، فسيتم استخدام الإعداد الافتراضي للنظام.على سبيل المثال ، http://vnc.example.com:5800 يتصل بالمنفذ 5800 من vnc.example.com ، والذي قد يكون مناسبًا لجلسة تحكم عن بعد لـ VNC. إذا تم حذف رقم المنفذ لـ http: URL ، فسيقوم المتصفح بالاتصال عبر المنفذ 80 ، منفذ HTTP الافتراضي. المنفذ الافتراضي لطلب https هو 443.
- يتم استخدام المسار لتحديد وربما العثور على المورد المطلوب. قد يصف هذا المسار أو لا يصف المجلدات الموجودة على نظام الملفات في خادم الويب. قد يكون مختلفًا تمامًا عن ترتيب المجلدات على خادم الويب. إنها حساسة لحالة الأحرف ، على الرغم من أنها قد تعامل على أنها غير حساسة لحالة الأحرف من قبل بعض الخوادم ، خاصة تلك التي تعتمد على Microsoft Windows.إذا كان الخادم حساسًا لحالة الأحرف وكان http://en.example.org/wiki/URL صحيحًا ، فعندئذٍ http://en.example.org/WIKI/URL أو /http://en.example.org/wiki سيعرض عنوان url صفحة خطأ HTTP 404 ، إلا إذا كانت عناوين URL هذه تشير إلى موارد صالحة بحد ذاتها.
- تحتوي سلسلة الاستعلام على بيانات ليتم تمريرها إلى البرامج التي تعمل على الخادم. قد يحتوي على أزواج اسم / قيمة مفصولة بعلامات العطف ، على سبيل المثال؟ first_name = tito& last_name = tech.
- يحدد معرف الجزء ، إذا كان موجودًا ، جزءًا أو موضعًا داخل المورد أو المستند بالكامل.عند استخدامها مع HTML ، فإنها تحدد عادةً قسمًا أو موقعًا داخل الصفحة ، وتستخدم مع عناصر الربط أو سمة "id" لعنصر ، ويتم تمرير المتصفح لعرض هذا الجزء من الصفحة.
يحدد اسم المخطط مساحة الاسم والغرض وبناء جملة الجزء المتبقي من عنوان URL. سيحاول البرنامج معالجة عنوان URL وفقًا لمخططه وسياقه. على سبيل المثال ، يقوم مستعرض الويب عادةً بإلغاء الإشارة إلى عنوان URL http://example.org:80 من خلال تنفيذ طلب HTTP للمضيف على example.org ، باستخدام رقم المنفذ 80.
تتضمن الأمثلة الأخرى لأسماء المخططات https و gopher و wais و ftp. تتطلب عناوين URL التي تحتوي على https كمخطط (مثل /https://example.com) أن الطلبات والردود ستتم عبر اتصال آمن بالموقع. تسمح بعض الأنظمة التي تتطلب المصادقة بإدراج اسم مستخدم ، وربما كلمة مرور أيضًا ، في عنوان URL ، على سبيل المثال ftp: //[email protected]. كلمات المرور المضمنة بهذه الطريقة لا تساعد على الأمان ، ولكن الصيغة الكاملة الممكنة هي :
scheme://username:password@domain:port/path?query_string#fragment_id
المخططات الأخرى لا تتبع نمط HTTP. على سبيل المثال ، يستخدم نظام mailto عناوين البريد الإلكتروني الصالحة فقط. عند النقر فوق في أحد التطبيقات ، قد يبدأ عنوان URL mailto: [email protected] مؤلف بريد إلكتروني بالعنوان [email protected] في الحقل "إلى". مخطط الهاتف أكثر اختلافًا ؛ يستخدم شبكة الهاتف العامة للتبديل من أجل العنونة ، بدلاً من أسماء المجالات التي تمثل مضيفي الإنترنت.
قائمة أحرف URL المسموح بها
1. الأحرف الغير محجوزة
يمكن ترميز الأحرف الكبيرة والصغيرة الأبجدية بشكل اختياري:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9 – _ . ~
2. الأحرف المحجوزة
يجب أن تكون الرموز الخاصة أحيانًا مشفرة بنسبة مئوية:
! * ‘ ( ) ; : @ & = + $ , / ? % # [ ]
العلاقة بين URL و URI
عنوان URL هو عنوان URI نفسه ، بالإضافة إلى تحديد مورد الويب ، وسيلة لتحديد موقع المورد من خلال وصف "آلية الوصول الأساسية (على سبيل المثال ، موقع الشبكة)".
أسماء مضيفي الإنترنت
اسم المضيف هو اسم مجال معين لجهاز كمبيوتر مضيف. عادة ما يكون هذا مزيجًا من الاسم المحلي للمضيف واسم النطاق الأصلي. على سبيل المثال ، يتكون en.example.org من اسم مضيف محلي (en) واسم المجال example.org. يتم ترجمة اسم المضيف إلى عنوان IP عبر ملف المضيفين المحليين ، أو محلل نظام اسم المجال (DNS). من الممكن أن يكون لجهاز كمبيوتر مضيف واحد عدة أسماء مضيفين ؛ ولكن بشكل عام يفضل نظام تشغيل المضيف أن يكون له اسم مضيف واحد يستخدمه المضيف لنفسه.
يمكن أن يكون أي اسم مجال أيضًا اسم مضيف ، طالما تم اتباع القيود المذكورة أدناه. على سبيل المثال ، يمكن أن يكون كل من "en.example.org" و "example.org" اسمي مضيفين إذا كان لكل منهما عناوين IP مخصصة لهما. قد لا يكون اسم المجال "xyz.example.org" اسم مضيف إذا لم يكن لديه عنوان IP ، ولكن "aa.xyz.example.org" قد يظل اسم مضيف. جميع أسماء المضيفين هي أسماء نطاقات ، لكن ليست كل أسماء النطاقات هي أسماء مضيفين.
بروتوكولات URL
يحدد بروتوكول أو مخطط عنوان URL كيفية الحصول على المورد. هناك بروتوكولان شائعان على الويب هما HTTP و HTTPS. لأسباب مختلفة ، تحولت العديد من المواقع إلى السماح بالوصول من خلال بروتوكولي HTTP و HTTPS. كل بروتوكول له مزايا وعيوب ، بما في ذلك بالنسبة لبعض المستخدمين أن أحد البروتوكولات الأخرى إما لا يعمل ، أو أنه غير مرغوب فيه للغاية. عندما يحتوي الارتباط على محدد بروتوكول ، فإنه ينتج عنه قيام المتصفح باتباع الارتباط باستخدام البروتوكول المحدد بغض النظر عن الرغبات المحتملة للمستخدم.
عناوين URL ذات الصلة بالبروتوكول
من الممكن إنشاء عناوين URL صالحة دون تحديد بروتوكول يسمى الروابط المرتبطة بالبروتوكول (PRL) أو عناوين URL ذات الصلة بالبروتوكول. يسمح استخدام PRLs على الصفحة لمشاهد الصفحة بزيارة صفحات جديدة باستخدام أي بروتوكول تم استخدامه للحصول على الصفحة التي تحتوي على الرابط. هذا يدعم الاستمرار في استخدام أي بروتوكول اختار العارض لاستخدامه للحصول على الصفحة الحالية عند الوصول إلى صفحات جديدة.
مثال على PRL هو //en.example.org/wiki/Main_Page الذي يتم إنشاؤه عن طريق إزالة بادئة البروتوكول.
عناوين URL الدولية
يتم توزيع مستخدمي الإنترنت في جميع أنحاء العالم باستخدام مجموعة متنوعة من اللغات والحروف الهجائية. يتوقع المستخدمون أن يكونوا قادرين على إنشاء عناوين URL بأبجدياتهم المحلية.معرف المورد الدولي (IRI) هو شكل من أشكال URL يتضمن أحرف Unicode وتدعم جميع المتصفحات الحديثة IRIs مع أجزاء عنوان URL التي تتطلب معالجة خاصة للأبجديات المختلفة هي اسم المجال والمسار.يُعرف اسم المجال في IRI باسم المجال الدولي (IDN). تقوم برامج الويب والإنترنت تلقائيًا بتحويل اسم المجال إلى رمز punycode يمكن استخدامه بواسطة نظام اسم المجال.على سبيل المثال ، يصبح موقع الويب الصيني http: // 見. 香港 هو التالي للبحث عن DNS. xn-- يشير إلى أن الحرف لم يكن ASCII في الأصل.
http://xn--nw2a.xn--j6w193g/
يمكن أيضًا تحديد اسم مسار URL بواسطة المستخدم بالأبجدية المحلية. إذا لم يتم ترميزه بالفعل ، يتم تحويله إلى Unicode ، ويتم تحويل أي أحرف ليست جزءًا من مجموعة أحرف URL الأساسية إلى أحرف إنجليزية باستخدام ترميز النسبة المئوية.
على سبيل المثال ، صفحة الويب اليابانية التالية http: // domainname / 引 き 割 り .html تصبح http: // domainname /٪ E5٪ BC٪ 95٪ E3٪ 81٪ 8D٪ E5٪ 89٪ B2٪ E3٪ 82٪ 8A.html. يقوم الكمبيوتر المستهدف بفك تشفير العنوان وعرض الصفحة.