::Trucos de google - buscadores y gestion documental

google en español, posicionamiento en buscadores, findability y gestión de contenidos

:: 1/30/2003 | enlace del articulo |

Premios 2002 de Search Engine Watch


logo de search engine watch
Igual que el otro día vimos los premios a los mejores buscadores de 2002, otorgados por la prestigiosa web sueca Pandia, esta vez podemos compararlos con los premios de Search Engine Watch, otra web aún más conocida, con votación popular incluida.

Coinciden en general, destacando por varios cuerpos de ventaja google (of course). En cualquier caso, a destacar servicios interesantes ya comentados:

  • Vivisimo y Copernic como metabuscadores,
  • los skins de Alltheweb para personalizar el interfaz,
  • el corrector lingüístico (spell cheking) de google como mejor servicio añadido (véase el ejemplo, jeje)
  • Interesantísima la categoría "Best Shopping Search Engine" (Mejor Buscador Comercial") y así que destaquen ¡POR FINNNN! un buscador como un servicio de valor añadido a cuidar en los sitios web de e-commerce. Años llevo diciéndolo, esto es findability hecha rentabilidad, usabilidad=dinero. Ganadoras ex-aequo de esta categoría: Yahoo Shopping y DealTime.


Para estudiarlo con calma en otro post, que tuve ya mi experiencia sobre esto en el portal de comunidades virtuales y e-commerce Temalia, hmmm...


:: 1/29/2003 | enlace del articulo |

La vida de una pregunta en google


cómo busca google
¿Siempre quisiste entender cómo buscaba (y encontraba) google un documento que respondiera a tu pregunta? Pues desde googleplex con amor, aquí nos cuentan cómo es la vida de una búsqueda, de forma muy gráfica y sencilla.

Por si hace falta, aquí tienes una versión en español, divertídisima porque es la que genera su traductor automático (traduce "home" -esto es, página de inicio o principal- como "casero", y así lo demás)


:: 1/27/2003 | enlace del articulo |

Todos contra google


ejemplo de skin del buscador FASt-alltheweb
Para mí que los competidores de google se reunieron hace cosa de un par de meses en algún callejón oscuro y han decidido atacar con todo lo que tienen. No dejo de ver noticias de otros buscadores rediseñando la apariencia de sus interfaces y mejorando o renombrando servicios.

Por ejemplo, Yahoo compra Inktomi, para no depender de las bases de datos de otros, como google; Altavista y Hotbot se renuevan la cara en un intento de servir para algo; Teoma dice "¡eh! ¡que estoy aquí!", y FAST se pone también del rollo coleguita y hace un concurso para que la gente haga skins divertidos de la interfaz de su buscador.

Para botón alguna muestra:



IBM promete superar a Google

IBM anuncia que en breve dará a conocer una nueva tecnología llamada Unstructured Information Management Architecture (UIMA). UIMA promete aunar diferentes aproximaciones de la Inteligencia Artificial en torno a la Recuperación de Información y la soñada Web Semántica. Se utilizará desde el cálculo estadístico de la relevancia de las respuestas de google, XML y RDF, a técnicas de Procesamiento del Lenguaje Natural.


:: 1/24/2003 | enlace del articulo |

Nos colamos en las oficinas de Google

Vía el servicio de noticias no oficial de google pero de lo más fiable, el excelente google blogspace de Aaron Schwartz, nos enteramos de que un chaval que entra a trabajar en la compañía Google tiene un blog en el que cuenta cómo es Google por dentro . No, no me refiero al algoritmo, "cacho perros", que ya os veo ya, sino las oficinas, el ambiente laboral, todo eso.

De su lectura extraigo algunas ideas interesantes para todo aquél que desarrolle proyectos tecnológicos, empresas de la nueva economía y demás fauna:

- La mayor parte de los trabajadores de google son Doctores (PhD).
Investigación e Innovación= DINERO

- Hay libertad para desarrollarte profesionalmente en diversos proyectos.
Diversión en el curro= DINERO

- Profesionales de distintos ámbitos hablan y escuchan.
Interdisciplinariedad= DINERO

- La mayoría provienen del rollo Open Source.
Software gratuito + imaginación= DINERO

- Escuchan a los usuarios. De hecho, sus APIS sirven para que otros les demos ideas.
Experiencia de usuario= DINERO

Parece el paraíso, leñe. ¡Tiene que haber truco! ¿Qué os parece? ¿Estáis de acuerdo?


:: 1/21/2003 | enlace del articulo |

Google en la mano: google palm y wireless

utiliza google en tu móvil o en tu palm

Por si no lo habíais visto, podéis usar google en vuestro móvil o en vuestra Palm o PDA.

En wireless google tenéis instrucciones bastante claras (aunque en inglés) de cómo usarlo en diferentes medios, como Palm, teléfonos móviles o Handspring Organizer.



Personalización mediante google con "googlert"

Ya podemos generar nuestro pequeño perfil de información personalizado mediante googlert, una nueva API de google.

Sólo hay que obtener una licencia para usar la API y registrarse (no siguen la cookie como el propio google, sorry) para saber y mantenernos al día de lo que dicen de nosotros, o de nuestros competidores, nuestros productos o nuestras necesidades de información (en la Red).

Inteligencia competitiva, vaya.


:: 1/15/2003 | enlace del articulo |

Findability (II): Disociación entre usability y findability.

He llegado a la conclusión de que si bien la usabilidad y la encontrabilidad van mezclados, hay quien conscientemente o por error, los ha disociado con resultados diversos: vender más (Hipermercados), "vender" menos (Bibliotecas españolas).

1. Disociación consciente de usabilidad y encontrabilidad: el caso del hipermercado.
Los hipermercados sabiendo mucho de ambas cuestiones las han disociado a propósito, y me explico:
Al saber cómo se comporta el usuario (lo saben requetebién, ya que no en vano son de los primeros en utilizar Datamining) y con su excelente control de estímulos varios (visuales, físicos, pulsión de compra,... ), te hacen fácil encontrar las cosas, eso sí imponiéndote un montón de problemas de usabilidad:

- hay que recorrerse todo el hiper para comprar productos complementarios
- el carrito se te va hacia un lado para que, la mano libre, te deje coger ese producto que te llama la atención, justo donde has chocado contra la estantería
- los cafés están todos juntos, pero el que es fácil de coger no es el que tu comprarías, sino el de la marca que más pagó por estar en la segunda balda...
- ... (espero sustituir los puntos suspensivos por vuestros comentarios ;-D )

2. Disociación inconsciente de usabilidad y encontrabilidad: el caso de las bibliotecas.

Muchos bibliotecarios son expertos en thesaurus, clasificaciones (CDU, listas de encabezamientos de materia, índices, etc.) Sin embargo, no ha existido (al menos en el panorama bibliotecario español) una conciencia clara de acercar todo eso al usuario (¿conoce alguien a algún usuario que sepa de CDU y busque por ella?) Y las fichas ISBD, ¿no son demasiado farragosas?. En definitiva, es muy difícil de usar toda esta organización del contenido, ya que no hay nadie/nada que nos facilite la utilización (usability) de estas herramientas tan complejas.

Haciendo una analogía con el mundo de la Web, a las bibliotecas les ha faltado una interfaz usable. En el mundo anglosajón (sobre todo el norteamericano), existe el bibliotecario referencista, alguien que hace que todas las clasificaciones sean para ti transparentes, y te busca lo que necesitas:

¿Os acordáis de la peli "Lorenzo's oil - El aceite de la vida"? En ella el bueno de Nick Nolte se tira media vida en la biblioteca pidiendo artículos, referencias, contactos, etc., que le ayuden en su búsqueda de información sobre la enfermedad que podría matar a su hijo. Y siempre había un sufrido bibliotecari@ que le ayudaba en su labor. Esto ya es más difícil de encontrar en las bibliotecas españolas. Recientemente, los OPAC en Web han venido a aliviar la situación, pero de su situación, que es aún muy pobre (y el motivo de ésta), os hablaremos muy próximamente con más detalle.

Claro que los presupuestos de las bibliotecas españolas no se pueden equiparar a las yankees, pero no siempre es cuestión de dinero, sino, como dice Álvaro Roldán en un comentario en el anterior artículo sobre findability: "Hay que ponerse en el sitio del usuario."

La verdad, nos sorprenderíamos de todo lo que podemos mejorar haciendo ese ejercicio.

:: Artículos relacionados:
- Findability (I): ¿Por qué los usuarios no encuentran nada en tu web?
- Nuevo palabro: tras la "usability", la "findability".


:: 1/14/2003 | enlace del articulo |

Findability (I): ¿Por qué los usuarios no encuentran nada en tu web?

En tu web, o en la nuestra, que nosotros estamos en casa del herrero (y ya sabes cómo son nuestros cuchillos...).
En la segunda edición de Information Architecture for the World Wide Web (2002, Editorial O'Reilly) de Rosenfeld y Morville, se acuña un nuevo concepto relativo a la Arquitectura de la Información (AI): Findability. Lo traduciremos como "Encontrabilidad", con o sin el permiso de la RAE, de la misma manera que Usability se tradujo com Usabilidad.

Rosenfeld y Morville postulan que la encontrabilidad o findability está antes que la usabilidad, ya que antes de poder usar algo, debes poder encontrarlo. Citando al bueno de Lou en su entrevista de Webreference: "[...]In short, findability precedes usability.You can't use what you can't find."

¿De cajón, no? Pues no tanto, a la vista de los desastres internáuticos que vemos cada día. La findability es la combinación de elementos estructurales de navegación, búsqueda, clasificación y etiquetado pero... con algo más de pimienta.

¿Cuál es el quid de la cuestión? En otras palabras, ¿cómo haces que un usuario encuentre lo que necesita? Pues es algo tan sencillo (aunque nada fácil) como hacer que cada elemento de contenido de tu sitio esté perfectamente diferenciado del resto (esto es, que esté descrito de forma unívoca). Sin embargo, eso no implica que los contenidos estén aislados herméticamente. Antes bien, dentro de las políticas de Encontrabilidad está la de relacionar contenidos que tengan algún factor común (ej. artículos de un mismo autor, de un mismo tema, de fechas cercanas, ...). Es decir, vamos a identificar cada elemento de forma precisa, pero permitiendo llegar a él a través de los contenidos relacionados. Es como hacer familias (normalmente taxonomías por temas) de contenidos.

En llegando a este punto os daréis cuenta de que las clasificaciones mediante lenguajes controlados se convierten en un pilar fundamental de la Encontrabilidad. Pero no os olvidéis de que el lenguaje natural (es decir, el que hablas con la vecina del tercer piso), es el que los usuarios utilizamos para buscar, por lo que a la hora de describir contenidos es muy importante que los metadatos del objeto en cuestión sean precisos (Ej: los metadatos de un libro son el título, autor, edición...) para mejorar su recuperabilidad.

Llegamos pues a la conclusión de que la Findability es la suma de la AI (sistemas de navegación, etiquetado, políticas de hipervinculación, ...) + sistemas semánticos (lenguajes controlados - como taxonomías, tesauros, encabezamientos de materia- ; y sistemas que soportan el lenguaje natural - sistemas de búsqueda-). No en vano encontramos sitios como Lexonomy, Semanticstudios hablando de la nueva fiebre que a algunos les ha dado con los tesauros, taxonomías, y demás formas de organización semántica del contenido de un sitio web.

De hecho, la excelente web Boxesandarrows, ha iniciado una serie sobre lenguajes controlados, donde se hablará de tesauros jerárquicos y facetados. A este respecto ya hablamos en su día del desmitificador artículo de Marcia Bates: "After de Dot-Bom..." Marcia es una autora de imprescindible lectura para cualquiera que quiera hacer AI (y no lo decimos sólo nosotros, también lo dicen en el "libro del osito"... ;-) y este artículo es muy, pero que muy sabroso truquer@s. Seguro que los que tenéis un background en LIS (lo que en castellano es Biblioteconomía y Documentación), disfrutaréis cual cochinillo en barrizal viendo cómo esta amable dama les tira de la corbata a todos los yuppies-punto-com que fueron por ahí reinventando ruedas: Los tesauros ya existían hace tiempo, y la DSI es un invento antiguo que no hay por qué rebautizar. Si seguís con Marcia Bates, tiene excelentes artículos sobre sistemas de clasificación.

Bueno, pues sin ánimo de plagio, seguiremos muy atentamente lo que vaya publicando Boxesandarrows, ya que nosotros nos unimos a la iniciativa con una serie de artículos sobre sistemas de clasificación. Ya sabéis: aquí, en Trucosdegoogle, o en tu boletín (aprovecha a suscribirte, que no te va a doler! ;-) ).

Por cierto, el otro día me decía Jorge que quería hacer un artículo sobre Findability en museos. - "Lástima - dije yo -, el Tío Morville se te ha adelantado hablando del tema en su artículo"Ambient Findability". No obstante, pensábamos en estudiar la Findability en el Guggenheim, o en el Metro, pero... Oh! Antes de acabar este post me he ido al Carrefour y... los carteles eran etiquetas, las naranjas contenido, la señorita de rojo una FAQ... ¿Qué me decís de la Findability de un hipermercado? Nos interesa saber cómo lo véis, qué cadena os parece mejor (en términos de Findability), etc. Tal vez así todos los Arquitectos de Información coincidamos en los pasillos de una gran superficie...

:: Artículos relacionados:
- Findability (II): Disociación entre usability y findability.
- Nuevo palabro: tras la "usability", la "findability".


:: 1/13/2003 | enlace del articulo |

Los premios Pandia de 2002

La prestigiosa web sobre buscadores Pandia ha publicado su lista particular de los mejores buscadores y sitios web relacionados con el mundillo.

Aquí tenéis un extracto de la lista:

- Best all round search site: Google
- Best professional search site: Fast AlltheWeb
- Best metasearch site: ez2www
- Best site on searching: Search Engine Watch
- Best site on search engine marketing: Search Engine Watch
- Best search engine discussion forum: Webmaster World
- Best publication on searching: Find it online!
- Best publication on search engine marketing: Planet Ocean
- Best search engine weblog: Resourceshelf

Está claro que como estamos en "Spanish" no nos conocen, jeje. Si queréis, todavía podéis votar en otros prestigiosos premios, los Search Engine Watch Awards 2002


Para buscadores hiper-precisos, Search Engine Ultimate Interface

Gracias a un soplo de Alvaro Roldán, aquí tenéis el fruto del curro de un colega, Faganfinder.com, que permite filtrar la búsqueda de mil formas en diferentes buscadores, un pasote. Para encontrar agujas en el hiper-pajar.


HOTBOT renueva su cara

Impulsada por Terra Lycos, HOTBOT reaparece de sus cenizas (¿como Altavista? esto ya nos suena, ¿no?) Podéis echarle un ojo a las novedades que aporta sobre la antigua versión, con una clara tendencia a la customización.


Nuevos tipos de documentos en FAST

En ResourceShelf vemos cómo podemos buscar diferentes tipos de documentos. Ya lo habíamos comentado antes, pero no está mal saber que el mejor weblog del año sobre el tema cuenta esto bastante después que Trucosdegoogle, ¿no? ¡Toma ya autobombooooo!

En fin, ahí los tenéis:

filetype:pdf (Acrobat files)
filetype:msword (Word documents)
filetype:flash (Flash presentations)



:: 1/10/2003 | enlace del articulo |

Agujero de seguridad en la barra de Google

La barra de búsqueda que se puede descargar desde su web y que podemos utilizar directamente en nuestro navegador, ha tenido algunos agujeros de seguridad que ya han sido arreglados, por lo que la compañía aconseja volver a descargarse esta interesante utilidad gratuita y renovar así el software.

Los dominios de los buscadores, pirateados

Mientras Hanna Barbara consigue ganar un juicio por el dominio .com de Scooby Doo, Domain Surfer, un buscador especializado en nombres de dominio de internet, ha cuantificado por miles las variantes de nombres de buscadores famosos que los piratas de dominios han registrado durante los últimos años. Estos piratas juegan con los errores de tecleo de los usuarios para asegurarse un buen cupo de visitas a sus páginas web. Así, tenemos algunos ejemplos como googl.com, googel.com, googlr.com, googld.com, googlebuy.com o googlesex.com, que llevan a webs de lo más heterogéneo. En total, unos 400 dominios registrados contienen la palabra google.

Otro tanto ocurre con Lycos, unos 400 como Lcos.com, o los 200 de AltaVista, como AtaVista.com, o el mismísimo yahoo, que se lleva la palma con 2,500 variantes, como por ejemplo Yaho.com.

Saber cómo buscan los usuarios merece una investigación

Phibot, un motor de búsqueda especializado en medicina y ciencias experimentales, está desarrollando uno de los mayores estudios jamás realizados sobre conductas de búsqueda del usuario (user search behaviour)

Este buscador, que parte del Adaptive Read Project, cuenta en su índice con 70 millones de páginas especializadas en medicina y 200 millones de páginas sobre ciencia en general. Phibot intenta aprender, mediante técnicas de inteligencia artificial, de las respuestas de los usuarios, mejorando progresivamente la cualidad de los resultados basándose en nuestro comportamiento al usarlo.

También permite, identificando nuestro ordenador, construir un perfil personalizado para adaptarse a nuestros gustos y a lo que nosotros hemos entendido previamente como respuesta relevante.

Así, se nos invita a todos los que queramos utilizar su sistema de búsqueda, a ayudarles en la investigación y testado de sus algoritmos, aumentando el abanico de consultas y aprender de una mayor casuística. Además, el logfile o archivo de búsquedas y respuestas está accesible públicamente. Una joya para cualquier estudioso del User Search Behaviour, o especialista en marketing electrónico.





:: 1/07/2003 | enlace del articulo |

Año nuevo, gaiticas nuevas

¡Feliz año a los suscriptores de nuestro nuevo servicio de boletín (newsletter) y a los que pronto váis a serlo, jeje... !

Para estrenar el año, los reyes nos han traído tres gaiticas nuevas, que podéis probar a la derecha de este texto:-------->>>
  • Suscripción al boletín de nuevos artículos: muy útil para estar al "loro", así os avisamos de novedades; y es antispam garantizado, oyes, que lo odiamos a muerrrte :-P

  • Sistema de Puntuación de este humilde a la vez que exquisito y sin par blog ;-D en bitácoras.net, que ha tenido a bien incluirnos en su directorio. Por lo menos la honrilla queda, ya te digo.

  • La última la tenéis debajo: sistema de edición de comentarios. Así podéis aportar cosas sobre lo que vayamos contando, y todos aprendemos. Lo más parecido a un foro que hemos podido organizar en plan gratissss, mi tesssoro... Hala, a comentar qué os parece esto, y sed benévolos, ¡porfaplis!...



En cuanto organicemos el lío documental que tenemos con vuestros correos y nos recuperemos de la pos-cogorza de fin de año, atacamos con fundamento. Un abrazo y a empezar el año sonriendo. ¡Que lo googleéis bien!