مهارات البحث على الإنترنت

تعتبر عمليات البحث وإنتاج الأبحاث ثاني أكبر نشاط على الإنترنت بعد البريد الإلكتروني ولكن تورد دراسات عديدة أن معظم محركات البحث لا تطال سوى نسبة ضئيلة من محتوى الإنترنت الهائل أو ما يطلق عليه أعماق الإنترنت السحيقة

  • E-Mail
مهارات البحث على الإنترنت ()
 Samer Batter بقلم  November 25, 2001 منشورة في 
COMPANY:
-

MAGAZINE:
-

AUTHOR:
-


|~||~||~|وتقول شركة برايت بوينت أن حوالي 8000 تيرابايت من المعلومات تختفي في أعماق الإنترنت بينما لا يصل للسطح سوى 02 تيرابايت (كل واحد تيرابايت يساوي 1 تريليون بايت(6777261159901) ، أو مليون مليون بايت.وتشكل قواعد البيانات الخاصة بمواضيع معينة حوالي نصف مواقع أعماق الإنترنت هذه. ولذلك فالمعضلة الحالية هي أن المعلومات التي لا تعثر عليها هي بمثابة المعلومات غير الموجودة ولا أحد يحتمل تلك الخسارة في الاقتصاد الحالي الذي سمي باقتصاد المعلومات.
||**|||~||~||~|

لا يكتسب محتوى الإنترنت أهمية كبرى إلا إذا لبى متطلبات أكبر عدد ممكن من مستخدمي الإنترنت. فالمستخدم العربي مثلا سيقول أن الإنترنت لا تقدم الكثير إذا لم يجد ضالته بذاتها فيها، وهنا فهو يتوقع توفر مواقع عربية تقدم معلومات ومحتوى غني له. وكذلك هو الحال مع المختصين من المستخدمين العرب كالمهندسين وغيرهم من أصحاب الاهتمامات العملية المحددة. فإذا وجدوا ما يهمهم بالذات فسيقيمون الإنترنت بدرجة أعلى.لذلك فإن قيمة الإنترنت تنبع من تفعيل البحث فيها وتحسين نتائج البحث. وقد سمعنا على الأرجح أن كثيرين تراجعوا عن استخدام الإنترنت بل تخلوا عنها بعد مدة من اتساع شعبيتها على نطاق واسع. ويمكن أن نقول أن سبب عزوف هؤلاء عن استخدام الإنترنت هو المتاهات التي واجهتهم فيها دون أن يصلوا إلى ضالتهم. ولذلك نكرس هذا المقال لغاية تحسين نتائج البحث ومهاراته بالاعتماد على الأدوات المتوفرة حاليا مثل محركات البحث وبرامج مشابهة يعتمدها المستخدم في كمبيوتره.

||**|||~||~||~|

كابوس البحث!
تتطلب عملية البحث في أي مكتبة دليلا أو أسلوبا محددا للبحث لكن في حال الإنترنت وشبكات الكمبيوتر الداخلية لا تتوفر على الأغلب أدوات فعالة وجاهز للبحث والاستكشاف ضمن مواد ضخمة تتراوح بين النصوص والصور والوسائط المتعددة أحيانا.ففي مؤسسة أو دائرة حكومية تشكل الوثائق الورقية والمعلومات الرقمية عبأ كبيرا عند البحث فيها للوصول لمعلومة محددة موجودة بصورة أكيدة لكن العثور عليها كالبحث عن إبرة في كومة قش. أذكر مثلا، وخلال العمل بمحطة تلفزيونية عمليات البحث المنهكة التي تتم للحصول على مادة شاملة من نصوص وصور ومعلومات وأشرطة فيديو لحدث ما أو لشخصية معروفة، فهناك من يتوجه لرفوف أشرطة الفيديو وآخر يسعى بين أرشيف الصور المتوفرة، وغيره على الكمبيوتر يبحث عن نصوص مرتبطة بالموضوع، وكل هذا لتقديم مادة مفيدة مدتها ثلاث دقائق أحيانا. وكانت ساعات طويلة يقضيها عدد كبير من العاملين في المحطة ليتم استكمال المواد المطلوبة المختلفة.ومع بروز فائدة الشبكات الداخلية وقواعد البيانات تم تجاوز هذه المشكلة لتزيد الإنتاجية وسهولة العمل بصورة عامة في هذه الحالات التي تتكرر في أماكن عديدة بصورة مشابهة.

||**|||~||~||~|

التقنيات الجديدة
حيث تتغير معالم الإنترنت بصورة مستمرة فتغيب مواقع وتظهر أخرى بتقنيات جديدة مثل اعتمادها على قواعد البيانات وغيرها من التقنيات التي دخلت عالم مواقع وصفحات الإنترنت. ولذلك فإن مهارات البحث على الإنترنت تحتاج إلى صقل الأسلوب وتجديد الأدوات أي محركات البحث بغرض الوصول إلى المعلومات المطلوبة والتي يستهدفها البحث.
سنفترض أن المستخدم يدرك أن عليه في معظم الأحوال أن يبحث عن الكلمات الرئيسية في الموضوع الذي يبحث عنه، ويفضل عدم استخدام جمل مفيدة أو عبارات كثيرة بل يجب في معظم الأحوال البحث عن كلمة أو كلمتين في موضوع معين. ونذكر بطريقة البحث بالمنطق الجبري bolean باستخدام عبارات تحديد لنتائج البحث، فإذا أردنا لنتائج البحث عن شخصية لتكن مثلا، نيلسون مانديلا، أن تتضمن موضوعا إضافيا مثل الصين سنعتمد عبارة
AND China Mandela لنحصل عن كل ما يرتبط بموضوع مانديلا والصين أو إذا أردنا استثناء الصين من نتائج بحثنا عن مانديلا بل لنقل إذا أردنا استثناء ويني مانديلا زوجته، عن نتائج البحث سنعتمد Mandela NOT Winnie وعليكم ملاحظة الحرف الكبير لعبارات الجبر NOT OR AND إلخ.بالطبع لا تعمل هذه الطريقة بل العربية حسب علمنا في كل محركات البحث.

||**|||~||~||~|

البحث باللغة العربية
اعتدنا أن نتمكن من البحث بمحرك ألتافيستا بعبارات استفسار عربية لكنه تراجع في تقبله للعربية بعد توفر محرك بحث عربي وهو أراب فيستا arabvista.com والذي تحول اسمه إلى ''البّحار'' http://www.albahhar.com/
وطورت شركة الحمادي محرك بحث عربي هو أوس
WWW.AWSE.COM
ويعتمد أسلوبا جديدا وتقنيات حديثة لم نعتد عليها من قبل في محركات البحث العربية، إذ يقوم موظفو الموقع ومختصون بتقنيات البحث بتصنيف المواقع العربية وضمها لقواعد البيانات للموقع ليتم الاستفادة منها.

قمنا بتجربة مجموعة من محركات البحث التي تدعم العربية بصورة مقبولة وأهمها محرك البحث Multimeta.com وقدم لنا هذا المحرك نتائج ممتازة باستخدام عبارات وكلمات بحث عربية فمثلا، عند طباعة ''مجلة ويندوز'' تمكن من إحضار نتائج تقدم موقع مجلة ويندوز على الإنترنت وهو www.itp.net. ويمتاز هذا المحرك بسرعة البحث إذ يقوم فورا بعرض نتائج محركات البحث وبصورة غير مسبوقة من السرعة. ويعتمد محرك البحث على مجموعة من محركات البحث هي Altavista و Voila
مع كل من Excite و Lycos و MSN Ahha و Yahoo و HotBot
Entireweb وهو يدعم العربية بصورة ضعيفة وسنتناوله بصورة مفصلة لاحقا.
ويمكنك أن تجرب هذا المحرك بنفسك على العنوان www.multimeta.com أو يمكنك تنزيل البرنامج الخاص به وهو برنامج صغير يتم تنزيله بأقل من 3 ثوان. ويقدم الموقع ما يسمى بالبحث الحي live search ويراد بذلك البحث المباشر من غير ما هو متوفر في قواعد بيانات محركات البحث والتخزين المؤقت لأدلة ومواقع الإنترنت.

||**|||~||~||~|

نتائج البحث في بريدك!
يمكن للموقع أن يرسل نتائج البحث لمواضيع متعددة مرة واحدة ليتم إرسال النتائج لبريدك الإلكتروني.وهي طريقة تماثل عملية حفظ نتائج البحث لكي تتجنب إعادة البحث مرات عديدة لاحقا لنفس الموضوع. وكل مايلزمك هو إدخال بيانات شخصية قليلة وعنوان بريدك الإلكتروني للاشتراك مجانا بهذه الخدمة InYourBox.
محرك البحث http://www.2trom.com/
يدعم البحث بكلمات عربية وقد يلزمك تنشيط الصفحة لتنزيل محرك البحث لكسي بوت
http://www.lexibot.com/index.asp
ويمتاز برنامج محرك البحث هذا بمرونته في العمل على النقيض من نظيره المعروف Bullseye الذي سبق لنا الحديث عنه (وقدمناه على القرص المجاني للمجلة). فيمكنك تقليص واجهة البرنامج ليعمل في الخلفية دون استنفاذ موارد النظام كما هو الحال مع Bullseye.وكان اسم ليكس بوت هو ''ماتا هاري نسبة لجاسوسة مزعومة لكن غيرت الشركة التي اشترته اسمه.
ومن محركات البحث المهمة هناك موقع أدوبي الذي يتيح البحث عن وثائق أدوبي أكروبات http://searchpdf.adobe.com ( ويمكنك كتابة هذه الوثائق ببرنامج مجاني إذا أردت وتجدوه على موقع http://freebyte.com/office/#suites

||**|||~||~||~|

أدوات بحث للقرص الصلب
يمكن اعتماد بعض محركات البحث على الويب للبحث في كمبيوترك.فكلما ازدادت المعلومات على كمبيوترك كلما صعبت عملية العثور على ما تريده بالضبط ولذلك هناك برنامج البحث والاستبدال '' Search and Replace" من شركة فندك http://www.funduc.com/ Funduc أو أداة مماثلة من موقع http://www.vknoware.com/afr/index.htm
ولا يقدم هذا البرنامج أداة بحث قوية فقط بل يؤمن طريقة فعالة للاستبدال. لنقل مثلا أنه تم تغيير عنوان موقعك على الويب ولديك آلاف الملفات التي أصبحت تشير لعنوان الموقع القديم وتود تبديل كل ملف يضم الاسم والعنوان القديم ولديك ألف ملف بحاجة لتلك التغييرات.ويقدم برنامج البحث والاستبدال دعما للغات متعددة وذلك بتبديل ملف الربط srlang.dll ، في النسخة الإنكليزية لكن لا يتوفر ملف للعربية حتى الآن.

||**|||~||~||~|

القيمة العالية
تحاول بعض المواقع الاستفادة من الإنترنت بطريقة النشر لقاء دفع رسوم مالية للمشترك بهذه المواقع. وتختص هذه بمجالات أكاديمية يمكن أن يدفع لها المستخدم مبالغ مالية لنوعية المعلومات المتخصصة فيها مثل المعلومات المالية للمستثمرين : http://www.tradecompass.com و http://www.investext.com وأحدث البحوث العلمية والدراسات التقنية المتخصصة التي تستهدف شريحة يمكن أن تدفع رسوما مالية لقاء المحتوى المباشر على الإنترنت:
www.idealibrary.com ويقدم أحدث النشرات العلمية والمجلات التقنية والطبية المتخصصة لقاء مبلغ معين. ولكنه يقدم مواد قيمة بصورة مجانية، أو 53 دولار تقريبا لكل نشرة أو مقالة.وهناك موقع عبارة عن كاتالوج لأرشيف مصغر ''ميكروفيلم'' للصحف والنشرات والمجلات www.umi.com من الأعداد الأولى لبعضها في القرن قبل الماضي. وهناك موقع للموارد القانونية والمحاماة http://web2.westlaw.com/signon/default.wl.
قواعد بيانات حول البيئة وتأثير المصانع

www.informedia.cs.cmu.edu
www.alexandria.ucsb.edu/adl.html
مكتبة جامعة الإسكندرية الأمريكية
http://www.jstor.org/
موارد للجامعات والمكتبات والناشرين

||**|||~||~||~|

كنوز الإنترنت
استهلكت هذه العبارة كثيرا دون جدوى لكننا سنكسر تلك العادة ونقدم لكم كنوزا برمجية فعلا. حيث قمنا باستثمار اختباراتنا لمحركات البحث هذه لنعثر على أهم البرامج المجانية الكاملة على الإنترنت، هل يبدو هذا أقرب للحلم ؟ فما نعنيه هو برامج مجانية تشمل مجالات عديدة من تحرير النصوص والصور وحتى قواعد البيانات والتصميم الهندسي CAD. ما رأيكم مثلا ببرنامج يماثل برنامج ACDSEE لكنه لترتيب النصوص وهو مثالي لمن يريد تصميم كتاب أو مرجع دائم له بأسلوب قواعد البيانات أو الترتيب الهرمي. ونستخدم هذا البرنامج نحن في قسم حلول ويندوز حيث يكفي أن نبحث تحت اسم برنامج، ليكن إنترنت إكسبلورر لتظهر لنا المعلومات المطلوبة حين يسأل أحد القراء عنها لنرسلها له بالبريد الإلكتروني بسرعة.
عثرنا على موقع يقدم تطبيقات وبرامج مجانية لجميع التصنيفات وهو:
http://www.freebyte.com
http://www.tinyapps.org/
وتجدون فيه برنامج كاد وبرامج تصميم فيزيائي وحراري إلى جانب مجموعة متنوعة من البرامج الأخرى

||**|||~||~||~|

البحث عن فيديو!
أصبحت الإنترنت غنية بالفيديو الذي يبث عبرها بكميات هائلة، فكيف يمكننا العثور على لقطة ما أو مقاطع فيديو لحادثة أو لشخص. تعتبر عملية فهرسة الوسائط المتعددة أكثر تعقيدا من فهرسة النصوص، وفي بعض الأحيان يتم تحويل الوسائط المتعددة إلى نص مثل فيديو البث التلفزيوني والذي يتضمن نص رقمي يقدم لمن يعاني مشاكل في السمع كما هو الحال مع أفلام الفيديو الرقمي DVD وبالاعتماد على برامج التعرف على المحارف OCR يمكن تحويل هذه إلأى نص، كما يمكن لبرامج التعرف على الكلام أن تحول الصوت المنطوق في الملفات الصوتية.
يمكن البحث في قاعدة بيانات عن مادة فيديو عن طريق توجيه البحث للعثور على صورة ما لنقل أنها وجه شخص. ويتم ذلك بتحديد بيانات الفيديو video dataولدى بعض محطات التلفزيون مئات الآلاف من ساعات الفيديو على الأشرطة أو مخزنة رقميا على أقراص مدمجة أو أقراص فيديو رقمي dvd. هناك محركات بحث معدودة تقوم بفهرسة واستعادة الفيديو على الإنترنت مثل ألتافيستا لكن هذه تعتمد على الفيديو المضمن في صفحات الويب تحت كلمات يمكن البحث من خلالها أي أن العملية هي عملية بحث عن نص وليس عن فيديو بذاته وكذلك هو حال الصور حاليا على محركات البحث في الإنترنت. وقامت شركة Virage بتطوير محرك بحث لشبكة تلفزيونية على الإنترنت، يتيح البحث ضمن نص الفيديو أو السيناريو المقروء من قبل الأشخاص، ولنقل أنه برنامج عن رحلات فضائية، وتبحث عن عبارة هي'' مركبة في الفضاء''. سيتيح هذا الوصول لمقاطع فيديو في البرنامج يتم فيها الحديث عن مركبة فضائية وتحصل على مقاطع يرد فيها ذكر مركبة فضائية مهما ترددت.ولكن لن تحصل على نتيجة لاستفسار مثل''كل مقاطع الفيديو لرائد الفضاء خارج محطة مير''.ويمكن لأدوات قواعد البيانات وبحث الفيديو أن تعثر مباشرة على الصور وهي طريقة أقوى من عمليات البحث بالكلمات الرئيسية keyword searches.

||**|||~||~||~|

وتقوم مجموعة من الباحثين في جامعة كولومبيا بتطوير برامج للبحث في الفيديو عن مزايا محددة مثل أشكال مميزة أو ألوان محددة أو حركة خاصة.ومثلا يمكنك اختيار صورة ثابتة من مصدر ما وتطلب من البرنامج أن يبحث عن نتائج مطابقة لها في إطارات الفيديو، أو يمكنك رسم شكل تقريبي لمحطة مير الفضائية ثم تطلب من البرنامج البحث عن صور مطابقة لها في مقاطع الفيديو.و لا تقتصر فائدة هذا البرنامج الذي أصبح جاهزا للعمل على مواقع الويب أو محطات التلفزة التي تحوي على مكتبات هائلة من الفيديو بل هناك الكثير من الاستخدامات الطبية وغيرها والتي تنتظره جميعا بفارغ الصبر. لكن الحلول التامة لم تصل مرحلة النضج بعد وفي غضون سنوات قليلة سيتحول الحلم إلى حقيقة ويتاح البحث عن الفيديو ليقدم نتائج دقيقة تماما.

البحث ولغة التعليم القابلة للتوسع
تقوم هيئة معايير الإنترنت W3.ORG بتعريف لغة XML على أنها طريقة لإنشاء البيانات ذات البنى structured data في ملف نصي ، ومانعنيه بالبيانات ذات البنى هو ملفات مثل الجداول الإلكترونية spreadsheets ودفاتر العناوين، والرسوم التقنية والصفقات المالية. وتقوم البرامج التي تولد هذه البيانات بتخزينها على أقراص بنسق ثنائي (1 و0)BINARY أو بنسق نص. ويتيح النسق الأول لك مشاهدة البيانات بدون الاعتماد على البرنامج الذي قام بتوليدها. ولغة XML هي طريقة أو إرشادات لتصميم نسق النص لتلك البيانات، وذلك لتوليد ملفات سهلة التوليد والقراءة على الكمبيوتر بصورة مستقلة عن نظام التشغيل. وهدف هذه اللغة تحسين أداء صفحات الويب والتطبيقات المتفاعلة معها أو التي تعمل بتقنياتها بحيث يتم التعامل بهذه الملفات دون مشاكل في التوافق. تقدم لغة التعليم القابلة للتوسع XML، Extensible Markup Language وسيلة هامة للبحث الدقيق. حيث تتضمن صفحات الويب المكتوبة بلغة ترميز النص المترابط HTML معلومات عن كيفية عرض النص ويتعرف المستعرض لديك أن رمز مثل H1 يعني سطرا كبيرا للعنوان الأعلى. لكن هذه اللغة لا تقدم لنا طريقة لوصف محتويات النص حيث يضيع المعنى بسبب الافتقار لتعليمه وتمييزه من حيث المعنى والمضمون. فمثلا إذا كان لديك كاتلوج لمواد ذهبية محفورة باليد فإنك ستود لو يمكنك أن تذكر قياساتها ولونها وسعرها، ومن المفيد جدا لك أن تتمكن من توريد القائمة الخاصة بهذه المواصفات إلى قاعدة بيانات. هذا ما تتيحه لغة التعليم القابلة للتوسع XML. فهذه اللغة تقدم نظاما معياريا لمستعرضات الويب والتطبيقات الأخرى للتعرف على البيانات في العلامات البرمجية TAGS. وستحل هذه اللغة معضلة البحث على الويب فبدلا من البحث ضمن كامل النص في صفحة ما يمكن لمحركات البحث الاعتماد على علامات برمجية للغة XML لتحديد أي جزء من الصفحات يجب أن يجري البحث به للوصول لنتائج بحث دقيقة. فمثلا، يمكن للبحث عن شخص مشهور أن يورد نتائجا تتضمن جامعات أو شوارع أو مدن تحمل اسمه، إضافة لمواضع عديدة كمحاضرات حوله إلخ.ورغم أن النتائج هذه ستكون مثيرة للاهتمام إلا أنها تسبب مضيعة لوقت الباحث فأنا مثلا أبحث عن إدوارد سعيد وحده ككاتب وأريد معلومات مفيدة عنه هو فقط. ولكن قبل أن ينجح البحث بلغة XML لا بد من توافر عوامل عديدة هي دعم متصفحات الإنترنت لهذه اللغة وفي الوقت الراهن ستحتاج مواقع الويب تأمين نسختين من صفحاتها الأولى بلغة XML والثانية بلغة HTML لضمان توافق كل المتصفحات معها. ومن الملاحظ أن هذا المعيار بدأ فعلا بالانتشار جدا على كل المستويات. حيث تعتمده الكثير من مبادرات الحكومة الإلكترونية ومواقع التجارة الإلكترونية لتشكيل الوثائق والشهادات والمعلومات الخاصة.

||**|||~||~||~|

مزاوجة قواعد البيانات ومحركات البحث على الويب
في الوقت الراهن تقوم معظم أدوات البحث بفهرسة وبحث الوثائق الاعتيادية مثل النصوص وملفات تحرير النص كوورد وملفات أدوبي PDF، وهي محركات بحث نصية بدون بنية خاصة بينما تقدم لغة XML حلا لتخزين البيانات ذات البنى يمكن اعتمادها في قواعد البيانات ولتقديم طرق متطورة للوصول لتلك البيانات. وحينها سيكون بالإمكان الحصول على البيانات مهما كانت صغيرة أو معقدة لتقديم تقارير تجيب عن أسئلة وعمليات بحث كثيرة مثل الاستفسار في شركة عن عدد سلع معينة تم بيعها في شهر محدد من العام المنصرم.إذا فالبحث عن النص يدور حول الوثائق بصورة كليا أما لغات الاستفسار query languages في قواعد البيانات فتسعى خلف أنواع أخرى من البيانات مثل حقل مفرد بعلامة برمجية معينة TAG أو سجل يضم حقولا متعددة. كما أن البحث في النص يجلب قائمة من الوثائق تحمل في طياتها معلومات هي نتيجة البحث، بينما تجلب لغات الاستفسار بينات استخلصت من وثيقة مثل حقل معلم أو سجلات متعددة.
كما يورد موقع هيئة معايير الإنترنت:
http://www.w3.org/TR/xmlquery-use-cases
وتقوم لغات الاستفسار بإجراء عمليات حوسبة وتنسيق تحويلي للمواد التي تعثر عليها وتجمع البيانات من مصادر متعددة بل وتقوم بتحديث الوثائق تلقائيا، ولا تقوم عمليات البحث عن النص بأي من هذه.
وأصبحت لغات الاستفسار query languageالمعتمدة في قواعد البيانات وسيلة قريبة للعمل على الويب
لغات الاستفسار هي لغات خاصة لطلب المعلومات من قواعد البيانات،( مثلا ، ترجمة عربية لنص الاستفسار ''اختر الكل حيث العمر أكثر من03 والاسم هو سميح''
SELECT ALL WHERE age > 30 AND name = "Samih"
تستفسر هذه العبارة عن كل السجلات التي تحوي حقلا باسم سميح وحقل العمر فيه قيمة أكبر من 03 سنة) تتيح جهود تطوير البحث بالاعتماد على لغة XML (XML Query) تأمين طرق مرنة لاستخلاص البيانات من الويب لتؤمن التعامل السلس بين عالم الويب وعالم قواعد البيانات ليصبح في النهاية الوصول لملفات XML كأنها قواعد بيانات.
ولدعم استفسارات لغة xml في البحث على الويب تتوفر لغة معيارية واحدة على الأقل تعتمد XML وستدعمها محركات البحث بصورة محدودة لتأمين بحث بالنص للوصول للوثائق المفهرسة دون الحاجة لكي يتعلم محرك البحث الخارجي على تعلم تحليل لغة XML.لكن محركات البحث لا تحتاج لانتظار لغة استفسار لتأمين الوصول لوثائق XML بل يمكنها العمل بفرز وبحث الفهارس لديها عن هرميات العلامات البرمجية tag hierarchies.
وعلى الويب هناك أعراف عديدة يعتمدها مطورو الصفحات ومحركات البحث للتحكم بالفهرسة.

||**||

يمكنك الآن الحصول على آخر الأخبار في صندوق الوارد لبريدك الالكتروني عبر الاشتراك المجاني الآن بـ نشرتنا الالكترونية.

إضافة تعليق

اسم المشترك، حقل إجباري

البريد الإلكتروني، حقل إجباري

Security code