هل تمت أرشفة موقعك جيداً في Google ؟
المشكلة الكبرى والأكثر شمولية التي تواجهنا في عملية تصدّر نتائج البحث في Google أن الموقع لم تتم أرشفته بشكل جيد. وفي هذه الحال لم يستطيع محرك البحث الدخول إلى موقعك أو جزء من الموقع لأرشفة المحتوى والصفحات الموجودة لديك.
لمعرفة ما إذا كان موقعك متأثر بسبب عملية الزحف والأرشفة، توجه إلى حسابك في أدوات مشرفي المواقع في Google وقم بالنظر إلى أرشفة Google في هذه الصفحة سترى عدد الصفحات التي قام محرك البحث بأرشفتها، إذا رأيت أن عدد الصفحات هذه في تراجع فأعلم أنك تواجه مشكلة حقيقية في أرشفة موقعك وهذه المشكلة ستؤثر أيضاً على ترتيب الموقع في نتائج البحث.
إيجاد السبب خلف مشكلة الأرشفة
إذا أمعنت النظر بالرسم البياني في أدوات مشرفي المواقع، سيكون من الواضح أن بعض الصفحات لم يستطع Google الوصول إليها / أو لم يجدها أساساً!
هذا الأمر يجب أن يدفعك للنظر بشكل أعمق في مشاكل موقعك والعمل على حلها، وسنتطرق في هذا المقال إلى ذكر أهم أسباب ومشاكل الأرشفة.
هل يواجه موقعك مشاكل في الأرشفة ؟
إذا أردت التعرّف ما إذا كانت Google تؤرشف موقعك بشكل كامل، توجه إلى أدوات مشرفي المواقع وأنظر إلى رسائل أخطاء الأرشفة التي يرسلها Google ” Crawler Error messages.” معظم المشاكل التي قد تحصل عليها مرتبطة بأخطاء 404 وهي اشارة عن أنه لم يتم العثور على الرابط المطلوب.
مشاكل الأرشفة الأخرى قد تكون مرتبطة بالأمور التالية :
- مشاكل في ملف Robots.txt:
كل ما تقوم بكتابته في ملف Robots.txt يؤثر بشكل مباشر على أرشفة موقعك في محركات البحث، بعض الأشخاص يبحث عن ملف Robots.txt جاهز وهذا خطأ كبير وعليك بدلاً من ذلك النظر إلى ما يحتاج إليه موقعك وعلى هذا الأساس تستمر على سبيل المثال وجدت في ملف الروبوت لأحد زبائني السطر التالي:
“User-agent: *Disallow: /”
بكل بساطة وظيفة هذا السطر هو منع جميع العناكب على الويب من الوصول إلى أي صفحة على موقعك وهذا واحدة من الأسباب التي تؤدي إلى منع أرشفة مواقعنا في محركات البحث وبالنسبة لأفضل ممارسة لملف الروبوت هو استخدام كود بسيط يظهر في داخله عنوان خريطة الموقع كما في الكود التالي :
لمدونات ووردبريس فقط!
User-agent: * Disallow: */wp-admin/ Disallow: */xmlrpc.php Disallow: */wp-*.php Disallow: *?wptheme= Disallow: *?replytocom Disallow: /wp-content/plugins/ Allow: /wp-content/uploads/ Disallow: /wp-includes/ Disallow: /seoforums/vbseo_sitemap/ Sitemap: http://www.seo-ar.net/sitemap_index.xml
- ملف .htaccess :
ملف مخفي وغير مرئي لكنه يستطيع القيام بأمور تؤثر بشكل سلبي جداً على موقعك، استخداماته عديدة جداً وأفضل الاستخدامات تكون في تحويل الروابط 301 ، قبل استخدام هذا الملف عليك التأكد من جميع الأكواد التي قمت باضافتها وما هو عملها وما الأمور التي ستقوم بالتأثير عليها في موقعك، وإلا قد تكون النتائج سيئة لموقعك وتوقف أرشفة الموقع بشكل كامل.
- وسوم الصفحات – Meta Tags :
الكثير من الأفكار والكثير من الدروس في عالم SEO هذا ما أراه على الأنترنت يومياً، لكن السؤال هنا من يقدم هذه الدروس وماذا تحتوي هذه الدروس ؟!!!
لماذا بدأت هذه الفقرة بهذه الجملة، السبب هو أن أحد أصدقائي كان يشاهد أن الشروحات على الانترنت لأحد الأشخاص المدّعين خبرتهم الكبيرة في السيو، وفي داخل الكورس في أحد الفقرات تمت اضافة كود الميتا تاغ التالي في تروسية الصفحات
<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>
تروسية الصفحة هذه تشير وتخبر عناكب البحث بعدم الزحف أو أرشفة هذه الصفحة.
من هنا يجب أن نتعلم أن لا نثق بما ينشر على مواقع الانترنت لأن الغالبية تجارية، وايضاً أن لا نضع أي كود قبل التأكد من عمله وذلك لضمان استمرارية الأرشفة في مواقعنا.
- خريطة الموقع – Sitemaps :
توجه إلى أدوات مشرفي المواقع وبعدها إلى موقعك ثم خريطة الموقع، في حال وجدت أخطاء في خريطة الموقع فهذا يقودنا إلى أن خريطة الموقع هذه لا يتم تحديثها وارسالها إلى Google بشكل سليم.
قم بمراجعة الإضافة التي تعتمد عليها في توليد الخرائط، راجع أيضاً أرقام الأخطاء التي تظهر لك، قم بالتحري عن أسباب الخطأ وإصلاحه بأسرع وقت ممكن.
ملاحظة: أهم الأمور التي يجب أن تحتوي عليها خريطة الموقع لديك هي ( صفحات الموقع – مواضيع الموقع – تصنيفات الموقع ) بالإضافة للصفحات ذات الصيغة الخاصة في حال وجدت وكان لها أهمية.
- أخطاء DNS والسيرفر :
أحب أن أطلق عليها الأخطاء القاتلة للموقع والقاتلة للترتيب، عليك دائماً مراقبة دخول عناكب البحث لموقعك وملاحظة ما إذا كان هذه الدخول يتم بنجاح أم ان هناك بعض المشاكل التقنية التي تعترض هذه العناكب أحياناً.
ولمعرفة ذلك يكفي عليك التوجة لأدوات مشرفي المواقع وفي رئيسية الأدوات سترى الصورة التالية التي ستظهر لك الأخطاء في حال وجدت:
- أسباب وراثية – Inherited Issues :
عندما نقوم بالحديث عن الأسباب الوراثية لعدم أرشفة الموقع فهي بكل تأكيد تعود إلى Domain الذي، في حال قمت بشراء دومين قديم لسبب ما، فمن المحتمل أن هذا الدومين يحمل معه عقوبة سابقة من Google وهذه العقوبة ستنقل تلقائياً لك، لذلك عليك الحذر عند التعامل مع نطاقات سابقة او منتهية المدة فغالبا ما تحمل لك عقوبات قد تجهلها.
شكرا ياغالى شرح مميز
العفو صديقي واتمنى لك الفائدة
شكرا
موضوع مميّز، والحمد لله، اتّبعتُ جميع الخطوات المذكورة. ^_^
أسعدني تواجدك صديقي وبالتوفيق
السلام عليكم الأخ ماجد
عندي سؤال وهو أني قمت بتوقيف خدمة RSS بموقي بواسطة كود لأن أحد المواقع كان يأخذ مواضيع موقعي من خلاله أتوماتيكيا وكان يحتل المراتب الأولى في نتائج البحث قبل موقعي، المهم حليت المشكلة، ولكن بعدها أصبح لدي العديد من أخطاء الزحف لروبوت جوجل من الشكل رابط الموضوع وفي نهايته /feed، فما هو الحل، للمعلومة فقط فهي أخطاء من نوع 500
وثانيا الكلمات الدلالية، عندما ينقر عليها الزائر فإنها تعتبر خطأ عندي في أدوات مشرفي المواقع رغم أنها تؤدي لصفة بالموقع بها الموضوع المتعلق بتلك الكلمة ولا يوجد أي مشكل، و المشكلة ايضا 500
فهل لهذه الأخطاء ضرر على أرشفة الموقع وترتيبه.
وشكرا لك على المدونة المفيدة جدا.
موقعك بحاجة لمراجعة من قبل مبرمج حتى يتبين الخطأ في ذلك او يمكنك مشاركتي الكود الذي استخدمته حتى احاول مساعدتك
شكرا لك الأخ ماجد على الرد و الكود هذا هو
unction disable_our_feeds() {
wp_die( __(‘خطـأ : نأسـف لإيقاف خدمة التغذية RSS في موقعنا ، فضلاً انقـر هـنـا للانتقال إلى الصفحة الرئيسية.’) );
}
add_action(‘do_feed’, ‘disable_our_feeds’, 1);
add_action(‘do_feed_rdf’, ‘disable_our_feeds’, 1);
add_action(‘do_feed_rss’, ‘disable_our_feeds’, 1);
add_action(‘do_feed_rss2’, ‘disable_our_feeds’, 1);
add_action(‘do_feed_atom’, ‘disable_our_feeds’, 1);
بدل من استخدام هذه الأكواد في ملف function قم بتثبيت الاضافة التالية : Disable Feeds
مشكور يا غالي فعلا نصائح مهمه وطيبه
ويجب على صاحب اي موقع مراعاتها بدقة
بالتوفيق
موقعي على الورد بريس وحزفت ملف الروبوت نهائيا واؤرشف المواضيع بشكل يدوي ..هل هذا له اي اثار سلبية ..؟
لا ليس هناك سلبيات
لكن يفضل وضع ملف الروبوت حتى لو كان فارغاً
موضوع جميل وشكراً لك..
أنا موقعي جديد وقمت بإضافتك, ولكن سؤالي ما هي المدة التي تستغرق ليتم البدء بأرشفته من قبل جوجل؟
حتى أنه عند محاولتي للبحث عن جزء من مقال قد لا يجدها, وإن وجدها يعطيني رابط الصفحة الرئيسية وليس رابط المقال.
عمر الموقع لغاية الآن عشر أيام…
وشكراً
الأمر يعود لنوعية وجودة المادة المقدمة، ولكسب الثقة في جوجل ومحركات البحث الاخرى ستكون بحاجة إلى ما يقارب 3 أشهر.
شكرا الك على الشرح الجميل
السلام عليكم
اعجبنى الموضوع فعلا يستحق القرائة مرة واثنتين وثلاث
ولى طلب صغير ان تقوم برماجعة موقعى فقد واجهت مشكلة رهيبه فى الموقع حيث نزل معدل الزوار فيه من 20 الف الى 3 الاف وحاولت جاهدا اعادته للواجه ولكنى فشلت حتى ان لو نشرت موضوع من الموقع على جوجل بلاس تظهر فى محرك البحث قبل الموضوع الرئيسى بالموقع بصراحة مخى وقف فقررت مراسلتك وعشمى فى خبرتك ان تتوصل للحل
كل الشكر مقدما
أهلاً بك عزيزي،
راجع مايلي فقد تجد الحل لمشكلتك
1- هل الروابط الخلفية لموقعك جيدة ام سيئة وفي حال كانت سيئة تنصل منها.
http://goo.gl/N99Hcj
2- هل المحتوى لديك حصري وذو جودة عالية.
http://goo.gl/iImfak
واتمنى ان يعود حال موقعك لما كان عليه يا عزيزي
أنا أملك الموثع لكن الدومين ليس بإسمي حاولت تفعيل موقعي على google لكن لم أستطع لأنه طلب معلومات عن الدومين هل يحق لي طلب الدومين أو معلومات الدومين من الشركة التي تعاملت معا لإنشاء الموقع ؟
شكرا جدا
يمكنك استخدام خيار رفع ملف HTML وهناك الكثير من الخيارات لتفعيل موقعك
يمكنك ان تطرح مشكلتك معنا على الرابط التالي : inboundery.com للحصول على اجابات احترافية صديقي.
مرحبا اخي
كلام جميل لمادا لا تضع لنا شرح فيه طريقة وضع الاكواد الصحيحة للروبوتات
وكداللك اكواد
ملف .htaccess :
تم تسجيل طلبك وسيتم وضع هذا الدرس قريباً
شكرا على شرحك ولكن مشكلتي ان المواضيع تتارشف في جوجل ولكن تتارشف بتاريخ قديم يعني اذا نشرت هسة يطلع الارشفة قبل خمس ايام
راجع توقيت الموقع لديك وأيضاً توقيت السيرفر قد يكون لهما تأثير في ذلك.
مشكوووور
السلام عليكم
شكرا لك الأخ العزيز
وجدت هذا الكود لملف robots.txt
فهل مناسب
User-agent: *
Disallow: /cgi-bin
Disallow: /wp-login.php
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /wp-content/themes
Disallow: /category/
Disallow: */trackback
Disallow: */feed
Disallow: */comments
Disallow: /*?
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$
Disallow: /*.gz$
Disallow: /*.swf$
Disallow: /*.wmv$
Disallow: /*.cgi$
Disallow: /*.xhtml$
وشكرا لك
لا بأس به ويمكنك استخدام كود اقل تعقيداً مثل الذي استخدمه في موقعي http://seo-ar.net/robots.txt
لدي مشكلة و هي عدم الأرشفة في موقع bing
قد تأخذ أرشفة Bing وقت أكبر من Google ولكن سيتم أرشفة موقعك في النهاية.
موضوع جميل يا صديقي ولكني اعاني من مشكلة فنيه علي موقعك كلما دخلته انا استخدم سفاري ففقط والقالب عندك مع السفاري يذهب يمين يسار هذا فقط للتوضيح
بالتوفيق ان شاء الله
الرجاء إرسال صورة عن شكل القالب على m.atwi@seo-ar.net
شكراً على تعاونك معنا صديقي.
ما شاء الله, سَلِمَت يَداك على الموضوع الجميل وحروفه الذهبية.
لي استفسار بارك الله فيك,
بما أني جديد في عالم المواقع الإلكترونية والاستضافات, قمت بإنشاء مدونة على وورد برس على استضافة hostinger, وأود السؤال هنا:
هل هذه الاستضافة آمنة وموثوقة؟
ولكَ كل الاحترام.
أهلاً بك عزيزي،
للأسف لم يسبق لي تجربتها .
معلومات تفصيليه رائعه ، تجيب على الكثير من التساؤلات .. بارك الله فيك وأعزك اخي ماجد
احسنت والله اني اكثر شخص تعرض لهاي النقاط الي ذكرتهن اخذ ملفات روبت جاهزه وطلع الشخص الي نطاني الملف عنده موقع منافس لموقعي وراد يحتل المرتبه مكاني
هدا الوسم عندما تجده فهو يكون لصفحة 404 not found وهدا مفيد في السيو
شكرا لك كلام مفيد ورائع
السلام عليك اخي اشكرك جدا علي هذه التدوينه الراعه
عندي استفسار انا بقدم خريطه المدونه يقولي خطأ عام لم نعثر علي صفحه404 بجد انا زهقت من الخطأ ده ومش عارف ازاي احل المشكله دي وبحثت كتير علي النت مفيش حد بيفدني ياريت تعطيني حل المشكله دي ولك جزيل الشكر
شكرا
شكرا علي المعلومات اخي الكريم لكن لا ننسي ان بعض المتطفلين وما اكثرهم في استخدام طرق احتيالية وغير قانونية في سرقة المحتوى والكلمات الدلالية لموقعك بعد ان تتعب كتيرا في بناءه
متلا المتطفل يدخل لموقعك وينسخ المحتوي الخاص بك وفي الميتا الخاص بالوصف meta descreption يقوم بتكرار نفس الكلمات وبكثرة بهذا يستطيع الحصول علي المركز الاول في بحث جوجل لتلك الكلمات
متلا لدي شات عرب شاترز هو موقع دردشة وعلي دومين خاص وبحماية SSL لكن بعض المواقع تقوم بعمل مجلد متلا ويسمونه arabchaterz علي الدومين الخاص به بحيث انه موقعه لايمت باية صلة او محتوياته ليست مطابقة لعرب شاترز اذا يقوم بعمل صفحة وفي الميتا الخاص بالوصف يقوم بتكرار جملة واحدة عدة مرات متل عرب شاترز بهذا استطاع ان يحتل المركز الاول بمجلد علي دومين لايحتوي علي اي كلمة شات او عرب متلا علي عكس موقعي الوصف مطابق للدومين وحماية SSL السؤال جوجل للارشفة علي مذا تعتمد صراحة لاني والله تعبت اصمم واجتهد وفي الاخير المتطفل بصفحة واحدة يحطم موقعي باكمله
وضعت موقعي كمثال فقط لاني لي مواقع كتيرة تعرضت لنفس المشكل
ارجو الحل او اية نصائح تحياتي
السلام عليكم صديقي العزيز عندي موقع والمجلة وورد برس اريد سوي نسخة للمجلة لان مرة رحت للمحرر وغيرت باحد الاكواد ونعفس الموقع يعني خرب الا شوي يمكن الطريقة لعمل باك اب وعمل ريستور بعد الخراب ؟؟
تحياتي
هل في حال تم منع جوجل من أرشف ملفا ت الجايكوري و css ان يكون سلبي على الموقع
الف شكر
أواجه مشكلة في عدم أرشفة feed و tag لهذه الصفحات