::Trucos de google - buscadores y gestion documental

google en español, posicionamiento en buscadores, findability y gestión de contenidos

:: 12/18/2001 | enlace del articulo |

Las palabras vacías dejarán de serlo

¿Qué son las palabras vacías? Para la recuperación de información moderna, aquellas que se repiten demasiadas veces en un texto, como artículos, conjunciones, preposiciones, etc, y que son tan comunes que no sirven para diferenciar un texto de otro, no permiten hacernos idea de qué está hablando.

Los motores de búsqueda conservan archivos de palabras vacías para luego no reconocerlas al generar los índices de todas las palabras de que consta cada documento indexado. De esa forma sus archivos de páginas no ocupan tanto tamaño como parecería en un principio.

Bien, eso hace que cuando busquemos algo como 'gestión de contenidos' (salvo que escribamos la expresión entre "dobles comillas") un buscador cualquiera sólo encuentre gestión y contenidos, pero no "de". De hecho, en google veréis que os lo avisa.

La NOTICIA es que parece que google está mejorando un sistema para reconocer a la primera todas las palabras vacías, de forma que no dará el mismo resultado buscar por 'gestión de contenidos' que buscar 'gestión por contenidos'. Por el momento, en inglés todavía no reconoce "the", con lo que aún se puede usar un curioso truco, que es usar una palabra vacía como un comodín. En español funciona con "de". Por ejemplo, si buscamos piezas de materiales veremos que nos encuentra tanto "piezas de materiales" como "piezas con materiales" o "piezas en materiales".

Ah, me preguntas qué es un comodín. Un comodín permite al buscador sustituirlo por cualquier cosa, de forma que nos amplía la búsqueda. Los más típicos son ? que se puede sustituir por un sólo carácter, o * que sustituye a muchos.

Ejemplos: perr? permite encontrar por perro o perra
perr* permite encontrar perro, perra, perros, perras, perrera, etc.

Como vemos, una buena forma de ampliar los resultados. Porque no vamos a querer siempre ser muy específicos, ¿no?.


:: 12/10/2001 | enlace del articulo |

Alltheweb (FAST) le quita el premio a Google

Como ya comentábamos en un post anterior hace no mucho, la última versión de alltheweb.com, servicio ofrecido por FAST, no sólo está cosechando buenas críticas, sino que ha conseguido los premios "Best of the Net" de About.com y "Hot Site of the Day" de USAToday.com.

Ayayay, sí aún me voy a tener que cambiar el nombre del blog éste, ¿no?

En un artículo de linux journal, Google vs. AllTheWeb nos comparan ambos motores. Y google pone sobre la mesa los siguientes datos:

-Data centers: 4
-Linux computers: >10,000
-Searches per day: >150 million
-Index of Web pages: >1.6 billion
-Image base: >330 million
-Usenet messages: >650 million (going back >5yrs)
-Newsgroups: >35,000
-Language interfaces: 66
-Language subsets in the index: 28
-International domain sites: 23
-PDFs: >22 million
-Included in searches by file type: wk1,wk2, wk3, wk4, wk5, wki, wks, wku, mw, xls, ppt, doc, wks, wps, wdb, wr, irtf, ans, txt

La guerra está en marcha. ¿Quién ganará?

Espero que nosotros, los usuarios.


:: 12/03/2001 | enlace del articulo |

google permitirá votar con su barra de navegación

Parece que google se suma a otras herramientas como Alexa para obtener estadísticas de usuarios por paneles, midiendo el grado de calidad de las webs mediante la votación activa de los usuarios.

Para ello necesitaremos descargar la nueva versión beta de su barra de navegación, algo de lo que quería hablar otro día más tranquilamente, pero bueno, ahí va. Es muy útil porque


  • A) nos ahorra tiempo porque buscamos en google sin tener que ir a google,

  • B)también podemos ir a los grupos de usenet, al directorio o a su home, directamente,

  • C) nos permite buscar con su tecnología directamente dentro de un sitio web de nuestra elección (siempre que esté indexado por googlebot) lo que viene muy bien si esa web no tiene buscador propio, y por supuesto puede ser incluso mejor que el propio buscador interno;

  • D) nos da el ránking general de interés del sitio (según él, claro)

  • E) si la hay, nos lleva a la categoría relacionada con ese sitio en el Open Directory Project.


Y todo desde la barra de navegación del navegador. No está mal, ¡eh?

Total, a saber cómo venderá después la información que obtiene de los que usamos la "toolbar". Anda que no le sacará rendimiento, vaya que sí. Yo lo haría.