توليد ملف robots.txt على الإنترنت

افتراضي - جميع الروبوتات هي:
فاصل البحث:
Sitemap: (فارغ للعدم)
روبوت بحث عادي: Google
googlebot
Baidu
baiduspider
MSN Search
msnbot
Yahoo
yahoo-slurp
Ask/Teoma
teoma
Cuil
twiceler
GigaBlast
gigabot
Scrub The Web
scrubby
DMOZ Checker
robozilla
Nutch
nutch
Alexa/Wayback
ia_archiver
Naver
naverbot, yeti
روبوت بحث خاص: Google Image
googlebot-image
Google Mobile
googlebot-mobile
Yahoo MM
yahoo-mmcrawler
MSN PicSearch
psbot
SingingFish
asterias
Yahoo Blogs
yahoo-blogs/v3.9
تحديد الدليل: المسارات نسبية، لكن يجب تضمين "/" قبل كل مسار.

ما هو ملف robots.txt

  • robots.txt(بأحرف صغيرة جميعها) هو ملف نصي يتم تخزينه في جذر موقع الويب. عادةً ما يخبر هذا الملف حواسيب التنقل لمحركات البحث (المعروفة أيضًا باسم العناكب الإنترنت) بأي محتوى من موقع الويب لا يجب أن يتم الحصول عليه من قبل عناكب محركات البحث، وأي محتوى يمكن أن يتم الحصول عليه (من قبل العناكب).
  • نظرًا لأن بعض أنظمة الـ URL حساسة لحالة الأحرف، يجب أن يكون اسم ملف robots.txt موحدًا بأحرف صغيرة. يجب وضع ملف robots.txt في الدليل الجذر للموقع.
  • إذا كنت ترغب في تحديد سلوك محرك البحث عندما يزور الروبوتات الفرعية للدليل بشكل منفصل، يمكنك دمج الإعدادات المخصصة في ملف robots.txt في الدليل الجذر، أو استخدام بيانات تعريف الروبوتات.
  • بروتوكول robots.txt ليس معيارًا، بل مجرد تقليد متفق عليه، لذا لا يمكن ضمان خصوصية الموقع. لاحظ أن robots.txt يستخدم مقارنة السلاسل لتحديد ما إذا كان سيتم جلب عنوان URL، لذا فإن وجود شرطة "/" في نهاية الدليل أو عدم وجودها يمثل عناوين URL مختلفة. يسمح robots.txt باستخدام أحرف البدل مثل "Disallow: *.gif".
  • بروتوكول روبوتات هو معيار أخلاقي متبع في عالم الإنترنت الدولي، وقد تم إنشاؤه بناءً على المبادئ التالية: 1. يجب أن تخدم تقنيات البحث البشرية، وفي نفس الوقت تحترم رغبات مزودي المعلومات وتحمي حقوقهم في الخصوصية؛ 2. لدى المواقع الإلكترونية المسؤولية عن حماية معلومات المستخدمين وخصوصياتهم من التعرض للإنتهاك.

محتوى ملف robots.txt

  • إمكانية الوصول أو التنقيب لعناكب محركات البحث.
  • إمكانية الوصول للمحركات البحث إلى الدلائل أو الملفات.
  • تعريف مسار خريطة موقع الويب.
  • الحد الزمني لفترات زحف العنكبوت في محرك البحث.

عن مولد ملف robots.txt

  • بعد تعيين البيانات التي تريد تكوينها من خلال واجهة الويب، اضغط على "إنشاء" في المولد للحصول على محتوى ملف robots.txt في مربع النص الموجود في أسفل الصفحة.
  • الآن، قم بإنشاء ملف نصي فارغ وسمه: "robots.txt"، ثم انسخ والصق المحتوى المذكور أعلاه في "robots.txt".
  • ضع "robots.txt" في الدليل الجذر لموقعك، وقم بزيارة robots.txt للتأكد من أنه يسمح للزوار (مثل محركات البحث) بالوصول إليه.

لقد استخدمت مؤخرًا:

جمع قائمة الطعام QQ