Seguindo?

“Scaneei” uma apresentação de um tutorial sobre desafios em escalabilidade e eficiência para engenhos de busca comerciais, por B. Barla Cambazoglu e Ricardo Baeza-Yates para o Yahoo! Labs Barcelona, indicada por João Rocha. Como não abordava aspectos de usabilidade, aproveitei mais a parte do histórico; da visão geral da anatomia dos resultados de uma busca (porque me ajuda a ver o vocabulário que costumam usar, e os destaques feitos) e de porque a tarefa de engenhos de busca é tão complicada. Os autores observam que a busca na web é difícil por conta de três aspectos, válidos para usuários e para a web em si:

  • tamanho
  • diversidade
  • dinâmica

Citando-os diretamente:

  • The Web
    • more than 190 million Web servers and 700 million host names
    • the largest data repository (estimated as 100 billion pages)
    • constantly changing
    • diverse in terms of content and data formats
  • Users
    • too many
    • diverse in terms of their culture, education, and demographics
    • very short queries (hard to understand the intent)
    • changing information needs
    • little patience (few queries posed & few answers seen)

Scalability and Efficiency Challenges in Commercial Web Search Engines

Advertisements
Leave a comment

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: