Advanced Search

المحرر موضوع: محركات البحث في الانترنيت (فريق الأعضاء)  (زيارة 1210 مرات)

0 الأعضاء و 1 ضيف يشاهدون هذا الموضوع.

فبراير 21, 2006, 12:08:57 صباحاً
زيارة 1210 مرات

أبو جعفر

  • عضو مساعد

  • **

  • 172
    مشاركة

    • مشاهدة الملف الشخصي
محركات البحث في الانترنيت (فريق الأعضاء)
« في: فبراير 21, 2006, 12:08:57 صباحاً »
محركات البحث في الانترنيت Search Engine
محرك البحث هو برنامج مصمم للمساعدة في العثور على المعلومات المخزنة على نظام حاسبي مثل الشبكة العالمية world wide web أو حاسب شخصي. يسمح محرك البحث للواحد أن يطلب المحتوى الذي يقابل معايير محددة (والقاعدة فيها تلك التي تحتوي على كلمة أو عبارة ما) ويستدعي قائمة بالمراجع توافق تلك المعايير. تستخدم محركات البحث مؤشرات/فهارس/مسارد منتظمة التحديث لتشتغل بسرعة وفعالية.
وهو يُتيح للمُستخدِمين البحثَ عن كلمات محددة ضمن مصادر الإنترنت المختلفة ويتألف محرك البحث من ثلاثة أجزاء رئيسة هي:
·   برنامج العنكبوت  .(spider program)
·   برنامج المُفهرِس  .(indexer program)
·   برنامج محرك البحث.
من الجدير بالذكر أن بعض محركات البحث تُستخدَم للبحث ضمن موقعٍ واحد فقط.
1 ـ برنامج العنكبوت:
تَستخدِم محركاتُ البحث برنامجَ العنكبوت (spider) لإيجاد صفحات جديدة على الويب لإضافتها، ويسمى هذا البرنامج أيضاً الزاحف (crawler) لأنه يُبحر في الإنترنت بهدوء لزيارة صفحات الويب والاطلاع على محتوياتها، ويأخذ هذا البرنامج مؤشرات المواقع من عنوان الصفحة (title)، والكلمات المفتاحية (keywords) التي تحويها، إضافة إلى محتويات محدِّدات الميتا (Meta tags) فيها. ولا تقتصر زيارة برنامج العنكبوت على الصفحة الأولى للموقع بل يتابع البرنامج تَعقُّبَ الروابط (links) الموجودة فيها لزيارة صفحات أخرى. أما الغاية من هذه الزيارات فهي وضع النصوص المنتقاة في نظام الفهارس لمحرك البحث، ليتمكن المحرك من العودة إليها فيما بعد، ولم تغب فكرة تغير المحتوى في الموقع عن بال مصممي محرك البحث، إذ ينظم محرك البحث زيارات دورية للمواقع الموجودة في الفهرس للتأكد من التعديلات التي تصيب المواقع المفهرسة.
2 ـ برنامج المُفهرس:
يُمثل برنامج المُفَهرِس (index program)، الكتالوج (catalogue) أحياناً، قاعدة بيانات (database) ضخمة تُوَصِّف صفحات الويب، وتَعتمد في هذا التوصيف على المعلومات التي حَصَلت عليها من برنامج العنكبوت (spider)  كما تعتمد على بعض المعايير مثل الكلمات الأكثر تكراراً من غيرها، وتختلف محركات البحث عن بعضها في هذه المعايير، إضافة إلى اختلافها في خوارزميات المطابقة (ranking algorithms).
3 ـ برنامج محرك البحث:
يبدأ دور برنامج محرك البحث (search engine program) عند كتابة كلمة مفتاحية (keyword)  في مربع البحث (search box) ؛ إذ يأخذ هذا البرنامج الكلمة المفتاحية ويبحث عن صفحات الويب التي تحقق الاستعلام الذي كونه برنامج المُفهرس في قاعدة بيانات الفهرس (index database) ثم تُعرَض نتيجة البحث المتمثلة بصفحات الويب التي طلبها المُستخدِم في نافذة المُستعرض .(browser window)
وتختلف محركات البحث عن بعضها في أسلوب العمل، فمثلاً: تحتفظ قاعدة بيانات ألتافيستا (AltaVista) بكل تفاصيل صفحة الويب المخزنة، أما غيرها من آليات البحث الأخرى فقد يحتفظ  بالعناوين الرئيسة للصفحة فقط، مما يؤدي إلى اختلاف نتائج شكل ودقة نتائج البحث الظاهرة للمُستخدم.

آليات البحث:
ذكرنا سابقاً أن محركات البحث تستخدم في بحثها عن مواقع الويب ما يدعى الكلمات المفتاحية (keywords) التي يمكن أن تكون كلمة أو عبارة (phrase). وتَستخدِم آلياتُ البحث عادةً بعضَ المعاملات (operators)، مع هذه الكلمات المفتاحية، لتوفير خيارات إضافية لعملية البحث. ونعرض في الجدول التالي كيفية عمل بعض هذه المعاملات، إلى جانب بعض الأمثلة عليها:
" " ـ يُستخدَم هذا المُعامل للبحث عن عبارة محددة.
 AND أو + ـ تُستخدَم مع مجموعة من الكلمات للبحث عن مواقع تحوي هذه الكلمات (منفردة أو مجتمعة).
OR ـ يُستخدَم مع مجموعة من الكلمات للبحث عن كل من هذه الكلمات المفتاحية على حدة  Computer OR technology .
النجمة *: يُستخدَم رمز النجمة للبحث عن كلمة عُلِمَ أحد مقاطعها، ويسمى البحث باستخدام المحارف البديلة.
ويمكن استخدام مجموعة من هذه المعاملات مع بعضها لتشكيل جُمل بحث متقدمة. ويمكن في محركات البحث تحديد مجالات البحث للوصول إلى نتائج أكثر دقة.

محركات البحث العربية:
ظهر مؤخراً بعض محركات البحث التي تدعم البحث باللغة العربية، ويكمن السبب في قلة هذه المحركات وتأخر ظهورها إلى التقنيات المعقدة التي يحتاجها البحث باللغة العربية. إذ تختلف طبيعة اللغة العربية عن الإنجليزية، فاللغة العربية لغة صَرفية (morphological)، بينما الإنجليزية لغة لصقية (affixational). ومن هنا كان لا بد للشركات التي تطرح محركات بحث عربية قوية أن تمتلك التقنيات اللازمة لمعالجة اللغة العربية آلياً.

 
وقد ظهر أثر ذلك في محركات البحث الموجودة التي انقسمت إلى مجموعتين:
المجموعة الأولى:
قلَّدت هذه المجموعة محركات البحث الإنجليزية ولذلك فقد جاءت نتائجها ضعيفة لاعتمادها في البحث على المطابقة الحرفية  (string matching)لكلمات البحث، مما يتسبب في حجب الكثير من المعلومات التي تتوافق مع الكلمات المراد البحث عنها (التي قد تختلف بأحرف زائدة بسيطة).
المجموعة الثانية:
اعتمدت هذه المجموعة من محركات البحث على تقنيات متقدمة لمعالجة اللغة العربية، ومن أبرز الأمثلة عليها: أراب فيستا (Arabvista) و الإدريسي؛ الذي أصدرته شركة صخر لبرامج الحاسب الآلي.
تتميز المجموعة الثانية بإمكانات إضافية مثل: البحث باللواصق، والبحث بالمشتقات. وقد استفاد محرك الإدريسي من التقنيات المتقدمة التي ابتكرتها شركة صخر في معالجة اللغة العربية، فتميز عن غيره بعدة أمور مثل:
1 ـ البحث بالمترادفات: تُستخدم للبحث عن نصوص عربية متشابهة المعنى.
2 ـ البحث بالمعاني والترجمة: تُستخدم للبحث عن نصوص إنجليزية عن طريق كلمة عربية يجهل المستخدم معناها.
3 ـ إمكانية  التعامل مع التشكيل بشكل جيد.
ومن الجدير بالذكر أن معظم محركات البحث العربية تقوم بعد معالجة الكلمة أو العبارة المراد البحث عنها بترجمتها إلى اللغة الإنجليزية، ليجري البحث عنها بعدة لغات في مواقع الويب المُفهرسة لديه.

 
محركات البحث العالمية:
جوجل:
حوالي 2001، برز محرك بحث جوجل. لقد قام نجاحه جزئياً على مفهوم رواج الرابط link popularity ومرتبة الصفحة PageRank. بمرتبة الصفحة يؤخذ في الاعتبار كم عدد المواقع والصفحات الأخرى التي تربط وصلة صفحة ما، على أساس مسلّمة التي مفادها أن الصفحات الجيدة أو المرغوبة تربط وصلتها أكثر من غيرها. ومرتبة الصفحات الرابطة وعدد الروابط علي هذه الصفحات تسهم في مرتبة الصفحة المربوطة. مما يجعل بإمكان جوجل أن يطلب نتائجه حسب عدد المواقع التي تربط وصلة كل صفحة تم العثور عليها. وكانت واجهة المستخدم المختزلة الخاصة بجوجل محل إقبال المستخدمين.
إن جوجل ومحركات ويِب أخرى لا تستعمل مرتبة الصفحة فحسب بل أكثر من 150 معياراً لتحكم على مدى الصلة. فالخوارزمي يتذكر أين كان الشيء ويفهرس العدد الموجود من الوصلات البينية ويبين علاقاتها في مجموعات. ومرتبة الصفحة قامت على تحليل (قياس وتعداد) ذكر المراجع/المصادر (المعلومات) – وهو قائم على علم القياس التوثيقي bibliometrics – الذي طوره في الخمسينات د. يوجين جارفيلد في جامعة بنسلڤانيا. ويذكر مؤسسو جوجل عمل جارفيلد كمصدر في ورقتهم البحثية الأصلية. وبهذه الطريقة يتم العثور على مجتمعات افتراضية من صفحات الويِب. وتستخدم تقنية بحث تيوما Teoma منهج مجتمعات في خوارزمياتها الخاصة بوضع المراتب. وقد عمل معهد بحوث إنإيسي على تقنية مشابهة. كان تحليل روابط الويِب قد تم تطويره في البدء بواسطة د. چون كلاينبرج وفريقه أثناء العمل في مشروع كليڤر بمعمل بحوث آلمادن في آيبيإم. جوجل هو أكثر محركات البحث شعبية في وقتنا هذا.

ياهو:
في 2002، حصلت ياهو على إنكتومي وفي 2003 حصلت ياهو على أوڤرتشر، التي كانت تملك أولذاوِب وألتاڤيستا. وبالرغم من امتلاكها لمحرك البحث الخاص بها، داومت ياهو أول الأمر على استخدام جوجل لتمد مستخدميها بنتائج بحث على موقعها الرئيسي ياهو.كوم. وعلى كل حال، ففي 2004، أطلقت ياهو محرك البحث الخاص بها القائم على التقنيات المولفة مما حصلت عليه ومقدمة خدمة أعطت الصدارة لمحرك بحث الويِب على دليل المواقع.

ميكروسوفت:
آخر أحدث محركات البحث الكبرى هو باحث إمإسإن، المملوك لميكروسوفت، التي اعتمدت فيما سبق على الآخرين على قوائمها لمحرك البحث. في 2004 دشنت نسخة بيتا (تجريبية) لنتائجها الخاصة بها، يدعمها زاحف ويِب يخصها (اسمه إمإسإن بوت). وفي أوائل عام 2005 بدأت عرض نتائجها الخاصة بها علنا. بالكاد لاحظ ذلك المستخدمون العاديون غير مدركين من أين كانت تأتي النتائج، لكنه كان تطوراً ضخماً بالنسبة لمديري مواقع كثيرين، ممن يبحثون عن الانضواء في محركات البحث الكبرى.
في نفس الوقت، توقفت ميكروسوفت عن استخدام نتائج من إنكتومي، والذي تملكه الآن ياهو.
كان هذا يعني أن السوق الآن تسيطر عليها جوجل، ياهو وميكروسوفت. ومحركات البحث الكبيرة (وصف ذاتي) الأخرى تميل لكونها ’بوابات‘ تعرض فحسب نتائج محرك بحث شركة أخرى (كما اعتاد باحث إمإسإن أن يفعل). ومحركات البحث ’الحقيقية‘ الأخرى (تلك التي تقدم نتائج من عندها)، مثل جيجابلاست، لديها حضور أقل بمراحل في السوق من الثلاثة الكبار. ومهما يكن، فبما أن المعلومات عن استخدام موقع ملكية خاصة، فمن الصعب عادة تحديد أي المواقع هي الأكثر شعبية.

تحديات تواجهها محركات البحث:
·   الشبكة العنكبوتية تنمو أسرع كثيرا مما قد يستطيع أي محرك بحث بالتقنية الحالية فهرسته.
·   صفحات وِب كثيرة يجري تحديثها مرارا، مما يدفع محرك البحث لزيارتها مجددا بشكل دوري.
·   عمليات البحث طلبا لمعلومات التي يقوم بها المرء محصورة حاليا على البحث في الكلمات المفتاحية، والتي قد تتسبب في الكثير من نتائج إيجابية زائفة.
·   المواقع المولّدة آليا (الدينامكية) ربما تكون بطيئة أو صعبة الفهرسة، أو قد تتسبب في إفراط بالنتائج القادمة من موقع واحد.
·   الكثير من المواقع المولّدة آليا (الدينامكية) غير قابلة للفهرسة بواسطة محركات البحث؛ وهذه الظاهرة تعرف باسم ’الشبكة غير المرئية‘
·   بعض المواقع لا تطلب النتائج بمدى الصلة، وإنما بحسب كم دفعت لها المواقع من الأموال.
·   بعض المواقع تصنع خدعا للتلاعب بمحرك البحث ليعرضها في النتائج الأولى كرد على بعض الكلمات المفتاحية. وربما يؤدي هذا لتلوث بعض نتائج البحث، مع تأخر الروابط الأقوى صلة في ترتيب قائمة النتائج.

  ':200:'
إننــــــــــــــــــــــــــــــــــــــــا                       عائدووووووووووووووووووووووووون

سبتمبر 10, 2007, 07:45:33 مساءاً
رد #1

jalal77

  • عضو مبتدى

  • *

  • 10
    مشاركة

    • مشاهدة الملف الشخصي
محركات البحث في الانترنيت (فريق الأعضاء)
« رد #1 في: سبتمبر 10, 2007, 07:45:33 مساءاً »
مشكوووووووووووووووووووور.
jalal77