Diario De Yasmin: ejercicio navegadores

EJERCICIO DE NAVEGADORES

¿Qué son?

Un navegador o navegador web, o browser, es un software que permite el acceso a Internet, interpretando la información de archivos y sitios web para que éstos puedan ser leídos.

¿Para qué sirven?

La funcionalidad básica de un navegador web es permitir la visualización de documentos de texto, posiblemente con recursos multimedia incrustados. Además, permite visitar páginas web y hacer actividades en ella, es decir, podemos enlazar un sitio con otro, imprimir, enviar y recibir correo, entre otras funcionalidades más.

Los documentos que se muestran en un browser pueden estar ubicados en la computadora en donde está el usuario, pero también pueden estar en cualquier otro dispositivo que esté conectado en la computadora del usuario o a través de Internet, y que tenga los recursos necesarios para la transmisión de los documentos (unsoftware servidor web).

Tales documentos, comúnmente denominados páginas web, poseen hipervínculos que enlazan una porción de texto o una imagen a otro documento, normalmente relacionado con el texto o la imagen.

El seguimiento de enlaces de una página a otra, ubicada en cualquier computadora conectada a Internet, se llama navegación, de donde se origina el nombre navegador(aplicado tanto para el programa como para la persona que lo utiliza, a la cual también se le llama cibernauta). Por otro lado, hojeador es una traducción literal del original en inglés, browser, aunque su uso es minoritario.

¿Cómo funcionan?

La comunicación entre el servidor web y el navegador se realiza mediante el protocolo HTTP, aunque la mayoría de los ojeadores soportan otros protocolos como FTP, Gopher, y HTTPS (una versión cifrada de HTTP basada en Secure Socket Layer o Capa de Conexión Segura (SSL)).

La función principal del navegador es descargar documentos HTML y mostrarlos en pantalla. En la actualidad, no solamente descargan este tipo de documentos sino que muestran con el documento sus imágenes, sonidos e incluso vídeos streaming en diferentes formatos y protocolos. Además, permiten almacenar la información en el disco o crear marcadores (bookmarks) de las páginas más visitadas.

Algunos de los navegadores web más populares se incluyen en lo que se denomina una Suite. Estas Suite disponen de varios programas integrados para leer noticias de Usenet y correo electrónico mediante los protocolos NNTP, IMAP y POP.

Los primeros navegadores web sólo soportaban una versión muy simple de HTML. El rápido desarrollo de los navegadores web propietarios condujo al desarrollo de dialectos no estándares de HTML y a problemas de interoperabilidad en la web. Los más modernos (como Google Chrome, Amaya, Mozilla, Netscape, Opera e Internet Explorer 9.0) soportan los estándares HTML y XHTML (comenzando con HTML 4.01, los cuales deberían visualizarse de la misma manera en todos ellos).

Los estándares web son un conjunto de recomendaciones dadas por el World Wide Web consortium W3C) y otras organizaciones internacionales acerca de cómo crear e interpretar documentos basados en la web. Su objetivo es crear una web que trabaje mejor para todos, con sitios accesibles a más personas y que funcionen en cualquier dispositivo de acceso a Internet.

Ejemplos de navegadores

Existe una lista detallada de navegadores, motores de renderización y otros temas asociados en la categoría asociada.

KHTML
- Konqueror (basado por defecto en KHTML)
- Basado en WebKit (fork KHTML)
  - Safari
  - Chromium
    - Google Chrome
      - SRWare Iron
    - Flock (a partir de la versión 3)
    - Opera
  - Epiphany (a partir de la versión 2.28)
  - Midori
  - Rekonq
  - Arora
  - Dolphin Browser
  - Sleipnir
  - Olive Browser
Internet Explorer y derivados:
- Avant Browser
- Maxthon
- G-Browser
- Slim Browser
- AOL Explorer
Mozilla (Gecko) y derivados:
- Mozilla Firefox
- Aurora
  - Flock (Descontinuado)
  - Iceweasel
  - Netscape Navigator (a partir de la versión 6)
  - Netstep Navigator
  - GNU IceCat
- SeaMonkey
- CometBird
- Beonex
- Navegador web IBM para OS/2
- Galeon (Proyecto abandonado)
- Skipstone
- K-Meleon para Windows
- Camino para Mac OS X
Amaya del W3C
- Abrowse
Netscape Navigator (hasta la versión 4.xx)
iCab
OmniWeb
Dillo
IBrowse
AWeb
Voyager
Espial Escape
HotJava
IEs4Linux
SpaceTime

Navegadores web basados en texto:

Primeros navegadores (que ya no están en desarrollo):

Diferencias de visualización entre navegadores ¿por qué ocurre esto?

Los sitios web Wix HTML5 están optimizados para funcionar correctamente en los navegadores y dispositivos más utilizados hoy en día. Sin embargo, es importante señalar que los distintos navegadores y dispositivos utilizan diferentes motores de visualización y por lo tanto pueden mostrar pequeñas diferencias en tu sitio web.

A veces, estas pequeñas diferencias pueden tener un efecto de dominó ejemplo, un 1% de diferencia en la representación de un tamaño de fuente, puede causar que una línea con sólo 20 caracteres aparezca como 1/5 del ancho del caracter. Si el cuadro de texto no tiene más espacio para el texto, esto puede hacer que la última palabra se monte en la línea siguiente, lo que hará que tu cuadro de texto se haga más largo y "empuje" al resto de los componentes de la página hacia abajo (si estás experimentando este problema, es muy fácil de resolver, sólo tienes que hacer el cuadro de texto un poco más amplio en tu editor para permitir extra espacio así el texto seguirá ajustado a su forma, incluso cuando éste se pueda ampliar) .

La web estándar sigue evolucionando y es importante mantenerse al día con las últimas tecnologías y estándares. Es por eso que Wix está a la vanguardia de desarrollo de sitios web HTML5. Estamos haciendo todo lo posible para minimizar los efectos causados por los factores mencionados anteriormente, sin dejar de ofrecer la flexibilidad necesaria para crear el sitio web más increíble en la red.

Por el momento, sin embargo, existe una solución alternativa que debería ayudar a reducir algunos de los problemas de alineación que puedas estar experimentando. Al colocar contenidos no alineados en una "caja", estás asegurando varios elementos diferentes dentro de una sola forma. Los elementos dentro de una "caja" se bloquean en su posición y por lo tanto parecerá que no se mueven o mandará otros elementos fuera de la alineación.

Usa una caja que hayas configurado para que aparezca transparente (asegúrate que la opacidad esté a 0) igual que tu caja.

Coloca todos los elementos dentro de esta caja para que se agreguen a él. Una vez estén dentro de la caja, estos elementos estarán unidos y no estarán desalineados.

Navegadores en modo texto

Un navegador de la web que funciona en modo texto, sin imágenes.

Lynx es un navegador que sólo muestra texto y que se puede utilizar en línea de comandos. La línea de comandos es la interfaz más simple de un sistema operativo, en la que todo lo que se desea hacer tiene que ser expresado en forma de instrucciones o comandos. La línea de comandos es típica de sistemas Unix o Linux, aunque hoy hasta Linux tiene un sistema de ventanas, por el que se pueden hacer casi las mismas cosas que por la línea de comandos. Windows también tiene su propia línea de comandos y es lo que antes se llamaba DOS.

Nota: Para acceder a la línea de comandos de Windows apretamos incio - ejecutar y escribimos la instrucción "cmd".

Lynx sólo permite ver texto, lo que resulta una gran desventaja! No obstante las imágenes, que no se muestran se indican con texto, poniendo elnombre del archivo o el texto que haya en el atributo alt de la imagen, si es que se había definido un texto alternativo.

Como funciona por línea de comandos tampoco es posible utilizar el ratón para ponerse encima de un enlace y pulsarlo, habrá que utilizar el teclado para moverse por los enlaces y entrar en ellos.

Todo ello, resulta cuando menos curioso y nos traslada a una época distinta, que casi parece ajena a nosotros.

Podemos ver el aspecto que tiene la página de Google con Lynx en la siguiente imagen:

Lynx es un navegador típico de sistemas Linux o Unix, originalmente creado para este último sistema operativo. También está disponible para otros sistemas como Windows u otros tan raros como Commodore Amiga.

La página web de Lynx es http://lynx.browser.org/, desde la que podremos encontrar más información de este navegador y descargar una versión para nuestro sistema operativo.

La versión de Lynx que funciona sobre Windows está en http://www.fdisk.com/doslynx/lynxport.htm

Conclusión

Queda decir que Lynx en un principio nos puede servir para poco, tal vez sólo como simple curiosidad. No obstante, podemos comprobar qué tal se ve nuestra web con este navegador. Así podemos ver si tenemos una web usable y accesible desde navegadores antiguos. En este sentido, de la accesibilidad, Lynx puede ser un buen referente, pues al navegar en modo texto, se puede combinar con otras tecnologías para hacer navegadores para personas discapacitadas.

¿Qué es un bot?

Los crawlers, spiders (arañas) o bots de los buscadores

Continuamos con la sección de teoría sobre motores de búsqueda (SRI —Sistemas de Recuperación de la información).

Hoy hablamos sobre los bots, crawlers o arañas de los buscadores.

El primer paso de un buscador es construir su índice. Para ello disponemos de una herramienta llamada crawler que indexa (indiza) las páginas web siguiendo enlaces, generalmente.

Para ser más gráficos, un ordenador (computadora) suministra una serie de direcciones al crawler, chequeando éste internet siguiendo enlaces y copiando todo aquello que puede o quiere.

Google posee muchos ordenadores (computadoras) con pocos recursos dedicadas a rastrear la web (Googlebot), analizar las páginas y servir las respuestas de nuestras búsquedas (4 millones de computadoras en 2007) . Además posee varios crawlers o bots especializados que se encargan solamente de rastrear las fotografías, adwords y adsense (publicidad).

Desde hace un poco más de un año Google ha cambiado el protocolo de búsquedas (caffeine) rastreando internet mucho más rápido. Integra resultados en cuestión de minutos o segundos, en clara lucha con los buscadores en tiempo real y Twitter donde la información llega instantáneamente (o casi).

La última de las grandes actualizaciones de algoritmo de búsquedas, el famosopanda update se ha centrado más en luchar —con más errores que aciertos— contra el spam.

Pero como no sólo de Google vive el hombre muchos otros crawler rastrean internet para estar permanentemente actualizados.

Hasta este año 2011 las páginas especializadas siguen la pista de más de 4,000 bots.

Como curiosidad algunos se dedican a rastrear la web copiando contenido y publicándolo en otros lugares. Otros simplemente son spambots que intentan dejar mensajes spam.

En los últimos años proliferan los spiders (crawlers), para usos más particulares aunque aún sigue siendo complicado instalarse uno.

Básicamente habría que instalar un servidor y una herramienta comoOpenSearchServer, un buscador de código libre. O Aspseek, ambos con licencia GPL. Los usuarios de Linux pueden disfrutar de una especie de crawler usando el comando wget.

También hay herramientas más automáticas como Httrack que sirven para descargar dominios completos, también llamados ripeadores de páginas completas. Suelen estar formados por un crawler y un parser.

Teniendo crawler propio podíamos indicarle que busque en todo un dominio, o que lo indexe (copie) entero, navegando por el sin estar conectados. Además de incluir comandos y formas de búsquedas más potentes que los habituales en los buscadores comerciales.

Por último recordar a los que tengáis página web que se puede controlar la actividad de la mayoría de ellos a través del archivo robots.txt. Una página muy completa para la creación del archivo robots.txt (en inglés) y otra buena guía en español en emezeta.

Diario De Yasmin

Menú

lunes, 23 de junio de 2014

ejercicio navegadores