Archivo de Febrero, 2009

Nestoria en Search Engine Estrategies en Londres 2009

Nestoria estuvo en la conferencia de Search Engine Strategies – SES en Londres esta semana. Muchos expertos en SEO – Search Engine Optimization, SEM – Search Engine Marketing y Analytics estaban allí, sobretodo de Estados Unidos y del Reino Unido.

También coincidimos con Albert García Labs Director y Albert López, SEO Manager, ambos de Softonic en Barcelona, David Carralón del British Council en París y nuestro amigo Andrés Carceller de Londres.

Asistimos a unas cuantas presentaciones y paneles. Quizás el más interesante de los últimos fuese el de ‘SEO – Where to Next?’. Chris Sherman (Search Engine Land), Brett Tabke (WebmasterWorld), Jill Whalen (High Rankings), Rand Fishkin (SEOMoz) y Kevin Ryan (Motivity Marketing) fueron moderados por Grehan (Acronym Media). Por cierto, yo no sabía que el término “black hat” fuese acuñado por Mike en su momento. Los caústicos comentarios de Kevin y el optimismo de Rand contrastaron con el pragmatismo de Chris, Brett and Jill.

Hicimos nuestros deberes ¿aprendimos a optimizar videos?

Hubo muchas presentaciones acerca de cómo optimizar videos e imágenes, quizás demasiadas. También es cierto que la atención a la optimización de video está basada en su vigoroso crecimiento de uso. Así que intentamos aplicar lo que aprendimos e hicimos un video con nuestras impresiones de la conferencia.

El video finaliza con una descarada promoción de nuestro sitio web de comparación de precios medios de vivienda por localidad, Nestolico. Una breve transcripción del video de Nestoria está disponible en Slideshare.

El reto de la ambigüedad

En este blog os hemos venido hablando de muchísimos temas acerca de Nestoria y la búsqueda vertical. Relevancia, usabilidad, velocidad y amplitud del índice son fundamentos clave para nosotros. No obstante, hay muchas pequeñas cosas que el equipo técnico se encuentra por el camino y que presentan la misma relevancia que los cuatro pilares antes mencionados. Hablo de la ambigüedad en búsquedas.

Muchísimas veces encontramos que una misma palabra sirve para identificar dos o más localidades e incluso lugares concretos asociados a un área (Ej.: un monumento o un lugar turístico). Los seres humanos nos acomodamos a nuestro propio lenguaje y hacemos sufrir considerablemente a un sistema de información. ¿Cómo adivinamos que un ciudadano madrileño se refiere a la “Glorieta de Bilbao” cuando escribe “Bilbao“? ¿Cómo deducimos que cuando un usuario busca una propiedad en “Sagrada Familia” se refiere a al area que rodea a la catedral de Barcelona y no al barrio del mismo nombre en la provincia de Jaén? ¿Te refieres a “San Sebastián” en Euskadi o a “San Sebastián de los Reyes” en la provincia de Madrid?

La verdad, no lo adivinamos. En muchos casos, el sistema automáticamente sirve la página de resultados de la localidad más relevante (por tamaño, número propiedades, búsquedas, etc). En otros, aplicamos la lógica de forma manual y artesanal. Como última medida, le damos la opción al usuario de elegir la localidad exacta, si es que no podemos certificar claramente que una de las localidades o áreas sea más relevante que la otra.

picture-2

Por supuesto, hay algunos lugares que son claramente ganadores y permitidme poner un ejemplo estupendo del Reino Unido. Hablo de casas en venta en Waterlooo. Después de las celebraciones post-Napoleónicas, muchos lugares adoptaron el nombre de la histórica batalla. En UK hay cinco lugares que se llaman Waterloo pero cuando una persona busca una casa por dicho nombre, generalmente se refiere al área que circunscribe a la estación dónde se rodó una de las escenas de la película The Bourne Ultimatum. En este caso aplicamos la práctica, experiencia y subjetiva lógica de enviar a nuestros queridos usuarios al Sur de Londres y no al pequeño pueblo de la región de Yorkshire que lleva su nombre.

waterloo

Diferenciar entre localidades que son realmente ambiguas y otras tan claras como la mencionada Waterloo es un reto. Es trabajo de back-end muy poco visible pero que garantiza un producto que sirva la página de resultados correcta. Es decir, que funcione.

Si encontráis algún ejemplo interesante que creáis debamos corregir, ¡no tenéis más que decírnoslo!

Entrevista Nestoria – Riccardo Zanussi – CTO Anuntis Segundamano

Riccardo Zanussi, CTO de Anuntis-Segundamano ha accedido a charlar con nosotros de Anuntis y de todo lo que rodea a su parte técnica. Anuntis es una referencia del clasificado en España y Ricardo se encarga de que todos los sites que componen el grupo tengan velocidad, sean de calidad y, por supuesto, lo mas eficientes posibles.

Hola Riccardo, gracias por unirte a la comunidad de Nestoria y compartir tu experiencia con todos nosotros. En primer lugar, un par de preguntas básicas. ¿De qué te ocupas en anuntis-segundamano y que actividades realiza todo tu equipo?

Anuntis es el líder en clasificados online en España con 22 webs entre España y Latino America. Desde casi 9 años soy el director de IT de Anuntis y decido y realizo todos los temas tecnológicos de Internet de la empresa. Gestiono todos los programadores y el sistema de todas las web de Anuntis (las más importantes, líderes en sus respectivos sectores son: segundamano.es, fotocasa.es, coches.net, motos.net, entre muchas otras).

Los programadores son los que realizan y mantienen todas las webs de Anuntis. No tenemos ningún outsourcing. Las personas de sistemas se encargan del entorno de produccion y se ocupan de mantenerlo vivo y con las “performance” necesarias.

He tenido la oportunidad de contemplar toda la logística tecnológica que rodea las operaciones de vuestros sites, la cual es ciertamente impresionante. ¿Cuáles son los retos técnicos que se os presentan a menudo?

Seguramente dos. Disponer de la velocidad y tener la disposición de las webs a nivel de máxima satisfacción para nuestros usuarios, tanto profesionales como particulares. Esto implica una continua revisión y adecuación, tanto de la arquitectura de las aplicaciones como de la arquitectura de los sistemas. Además significa también la necesidad de tomar decisiones de compras de ancho de banda y servidores.

Cuando empecé a trabajar en Anuntis hace casi 9 años, tenía en producción un servidor y 2 Mb/s de ancho de banda, además de una arquitectura de web server y  una base de datos para todos los portales. Ahora, en cambio, tenemos más que 250 servidores y 800 Mb/s de ancho de banda, una arquitectura distinta y compleja para cada web, incluyendo servidores de cache, reverse proxy de photos, cluster de base de datos, servidores de Business Inteligence, etc.

En muchas ocasiones, tenemos que rehacer la arquitectura (a veces completamente, hay veces solos en parte porque ha llegado a su máximo rendimiento. Y todo esto si dejar de dar servicio 24×7 a todo lo portales

¿Cuáles son las metas a corto y largo plazo que se ha planteado el equipo técnico de anuntis?

A corto plazo, seguramente cambiar completamente el actual sistema de monitoring a algo más completo. A largo plazo, tener todos los portales con opciones de failover en CPD distribuidos.

Muchos de entrevistados nos han mostrado su interes por proyectos como OSM y Geonames por ejemplo, ademas de revelarnos que son intensivos usuarios de software libre como PERL y PHP.  ¿Sois usuarios de software libre? ¿Hacia donde crees que pueden llegar este tipo de plataformas?

Nuestro entorno es casi completamente Microsoft (excepto para Segundamano.es que es con Linux).  No veo ninguna diferencia ni limitaciones en los dos campos. Los dos tipo de soluciones son perfectas para hacer sites performantes, seguro y fiable: depiende exclusivamente de las decisiones de arquitectura y de la capacidad de los programadores.

¿Qué importancia le da anuntis a la I+D tecnológica y como se aplican las novedades en sites como fotocasa o infojobs?

Continuamente buscamos las novedades tecnológicas, siempre que puedan aportar algo al negocio. No creo mucho el la novedad tecnológica sin un beneficio para el negocio: sirve para tener 15 minutos de celebridad a lo Warhol. Pero si no sirve para algo concreto para el usuario, los 15 minutos se quedan en 15 minutos

Por último, ¿qué dificultades técnicas crees que se le presentan a un buscador vertical como Nestoria?

El reto mas difícil  es seguramente la integración de anuncios desde diferentes portales cada uno con diferentes valores para los campos. Nosotros tenemos mucha experiencia en esto y sabemos lo importante que es. Durante unos años tuvimos  miles de anuncios moviéndose diariamente entre más de 200 revistas y 22 portales y tener en cuenta de todas las diferentes características de cada publicación es muy complicado logísticamente. Quiero felicitar al equipo de Nestoria por saber solucionar esto tema para todos los portales en manera óptima.

Gracias Riccardo. Os deseamos mucha suerte en todos los nuevos proyectos que llevéis a cabo durante el 2009.

Entrevistas pasadas: Gari Alaolaza, Brad Inman, Oscar Feito