Vantagens, desvantagens e riscos dos mecanismos de pesquisa da web profunda
Páginas da Web internas
Páginas internas da web consistem em páginas do site que levam vários cliques antes que o usuário possa vê-las. Essas páginas podem ser páginas de produtos, conteúdo ou banco de dados pesquisável que os mecanismos de pesquisa na Web normalmente não conseguem encontrar. A vantagem desse tipo de tecnologia de pesquisa é que os proprietários de sites podem ter produtos, lojas, informações e outros links valiosos incluídos no índice de um mecanismo de pesquisa da web. Isso torna o site mais visível na Internet.
Informação pessoal
Uma desvantagem de um mecanismo de busca profundo é que as informações pessoais são indexadas independentemente da privacidade. Informações como números de previdência social, informações financeiras ou localizações geográficas podem ser indexadas, mesmo se publicadas em uma página pessoal. Os mecanismos de pesquisa deram aos usuários a capacidade de bloquear informações de índice por meio de um arquivo chamado "robots.txt". Mecanismos de pesquisa como o Google permitem que os usuários removam URLs depois que o proprietário do site tiver excluído as informações desejadas, o que o remove do índice.
Automação
Os proprietários de sites podem ter páginas da Web indexadas colocando alguns links em outro site ou em seu próprio site. Essa prática é conhecida como "backlinking". Um site com backlink é automaticamente encontrado pelo mecanismo de busca, que pode então atribuir e indexar um site. Isso torna muito mais fácil para o proprietário de um site, já que ele não precisa enviar um nome de domínio para os mecanismos de pesquisa. A automação do índice facilita a localização de leitores na Internet.