Generador de robots.txt en línea - Herramientas en línea de bejson

Generador en línea de robots.txt

Predeterminado - Todos los robots son:
Intervalo de búsqueda:
Sitemap: (En blanco para ninguno)
Robot de búsqueda general:	Google	googlebot
	Baidu	baiduspider
	MSN Search	msnbot
	Yahoo	yahoo-slurp
	Ask/Teoma	teoma
	Cuil	twiceler
	GigaBlast	gigabot
	Scrub The Web	scrubby
	DMOZ Checker	robozilla
	Nutch	nutch
	Alexa/Wayback	ia_archiver
	Naver	naverbot, yeti
Robot de búsqueda especializada:	Google Image	googlebot-image
	Google Mobile	googlebot-mobile
	Yahoo MM	yahoo-mmcrawler
	MSN PicSearch	psbot
	SingingFish	asterias
	Yahoo Blogs	yahoo-blogs/v3.9
Restringir directorio:	La ruta es relativa, pero cada ruta debe incluir antes de ella: "/"

¿Qué es el archivo robots.txt?

robots.txt (en minúsculas) es un archivo de texto almacenado en el directorio raíz de un sitio web. Generalmente, indica a los rastreadores de motores de búsqueda (también conocidos como arañas web) qué contenido del sitio no debe ser accedido por los rastreadores de los motores de búsqueda y cuál sí puede ser accedido por ellos.
Debido a que algunas URL en los sistemas distinguen entre mayúsculas y minúsculas, el nombre del archivo robots.txt debe ser siempre en minúsculas. El archivo robots.txt debe colocarse en el directorio raíz del sitio web.
Si desea definir el comportamiento del rastreador de un motor de búsqueda cuando accede a un subdirectorio de forma individual, puede combinar la configuración personalizada en el archivo robots.txt en el directorio raíz, o utilizar metadatos de robots.
El protocolo robots.txt no es una norma, sino simplemente una convención, por lo que no puede garantizar la privacidad del sitio web. Tenga en cuenta que robots.txt utiliza la comparación de cadenas para determinar si se obtiene una URL, por lo que la presencia o ausencia de una barra diagonal "／" al final del directorio representa diferentes URLs. robots.txt permite el uso de comodines como "Disallow: *.gif".
El protocolo de robots es una norma moral aceptada internacionalmente en el ámbito de Internet, basada en los siguientes principios: 1. La tecnología de búsqueda debe servir a la humanidad, respetar la voluntad de los proveedores de información y proteger su derecho a la privacidad; 2. Los sitios web tienen la obligación de proteger la información personal y la privacidad de sus usuarios de ser violadas.

contenido del archivo robots.txt

Accesibilidad o rastreabilidad de los motores de búsqueda.
Accesibilidad de los motores de búsqueda a los directorios o archivos.
Definición de la ruta del mapa del sitio (sitemap) del sitio web.
Límite de intervalo de tiempo para el rastreo de arañas de motores de búsqueda.

Generador de archivo robots.txt

Configura los datos que deseas configurar a través de la interfaz web, haz clic en "Generar" en el generador y obtendrás el contenido del archivo robots.txt en el cuadro de texto de entrada en la parte inferior.
Ahora, crea un archivo de texto en blanco y nómbralo: "robots.txt". Luego, copia y pega el contenido anterior en "robots.txt".
Coloca el archivo "robots.txt" en la raíz de tu sitio web, y accede a robots.txt para asegurarte de que permita a los visitantes (como los motores de búsqueda) acceder a él.

Recientemente has utilizado:

Generador en línea de robots.txt

¿Qué es el archivo robots.txt?

contenido del archivo robots.txt

Generador de archivo robots.txt

Navegación del sitio BeJSON

Herramienta JSON

Codificación / Encriptación

formatear

red

Frontend

backend

Conversión

Otros

documento

Procesamiento de imágenes

procesamiento de texto

Matemáticas

Herramienta para webmasters

Color

herramientas de plataforma

más

Calculadora de hipoteca

Calculadora de préstamos de automóvil

Calculadora de intereses

calculadora inversa

Herramientas de aprendizaje

Grupo de QQ de BeJSON