Busca de informação na Internet

Slides:



Advertisements
Apresentações semelhantes
EBSCOhost Estilo guiado de pesquisa avançada
Advertisements

Pesquisa Avançada, Tutorial de Estilo Orientado
Tutorial de Pesquisa Básica de Bibliotecas Acadêmicas
Módulo II – Domine a Internet Introdução a Informática DCC - UFMG.
Support.ebsco.com Pesquisa básica para bibliotecas públicas Tutorial.
Support.ebsco.com Tutorial do Meu EBSCOhost Tutorial.
Pesquisar na Web e Avaliar a informação encontrada
TUTORIAL BASE DE DADOS SCIENCE DIRECT Elaborado por:
Support.ebsco.com Tutorial do Meu EBSCOhost Tutorial.
EBSCOhost Pesquisa básica para bibliotecas acadêmicas
MOODLE PARA TODOS Projeto EAD-CPD MOODLE UFBA Centro de Processamento de Dados - UFBA.
Sistemas automatizados de recuperação e disseminação da informação
CINAHL Tutorial de Pesquisa Básica
Conceitos Básicos de Computação
Conceitos Básicos de Computação O ABC da Computação.
Programas Utilitários Básicos
Introdução a Teoria da Classificação
Divisão de Biblioteca e Documentação FMUSP
Base SCOPUS 2011 Divisão de Biblioteca e Documentação FMUSP.
Internet: conceitos básicos
INTERNET O que é ? História da Internet Internet no Brasil
POWER POINT O POWER POINT é um editor de apresentações, pertencente ao
Denise Perdigão BASE DE DADOS Denise Perdigão
ESTADO DO PARANÁ NÚCLEO REGIONAL DE EDUCAÇÃO DE GUARAPUAVA.
A Internet, também conhecida como web, é uma rede de comunicação de milhões de computadores conectados, que oferece inúmeros serviços. São bilhões de.
Internet Principais conceitos.
A grande rede mundial de computadores
Comunicação na Internet e a sua utilização para o fortalecimento das comissões de saúde e segurança no trabalho.
Colégio Cruzeiro do Sul Informática Básica Profª.Michele
Internet é definida como diversas redes de computadores conectadas umas as outras. É considerada, uma rede de redes, formada por redes universitárias,
Tecnologias de Informação e Comunicação
Tutorial de pesquisa Bases da área de saúde.
Ferramentas de busca na WEB. Disciplina: Controle dos Registros do Conhecimento III Professora: Úrsula Blattmann Aluno: Marcos Henrique Camerini Universidade.
Engineering Village. Engineering Village – A Plataforma Desenvolvida pela Engineering Information (Ei), líder em fornecer informações.
Treinamento do Microsoft® Access® 2010
Projeto Inclusão Digital
Rodrigo Cristiano Silva
TUTORIAL. Acervo de 47 jornais especialmente selecionados pela British Library para melhor representar o século XIX. Inclui jornais nacionais e regionais.
O TelEduc: É um ambiente para a criação, participação e administração de cursos na Web. Foi concebido tendo como alvo a formação de professores para informática.
Contornos arquitetônicos Maria Helena Pereira Dias.
Navegando através das Fontes e Serviços de Informação da Biblioteca Virtual em Saúde - BVS BIREME/OPAS/OMS.
Ulisses e Página das bibliotecas da UL - Princípios orientadores -
Navegação na WWW (Web):
1. Aprenda o básico sobre o Google
MEIOS ELETRÔNICOS INTERNET PROFESSOR ENZO OLIVEIRA MOREIRA CURSO DE LETRAS 2002.
A abordagem de banco de dados para gerenciamento de dados
Nelson Vieira Nº 12 Manutenção Industrial. Servidor: Em informática, um servidor é um sistema de computação centralizada que fornece serviços a uma.
Curso: Análise e Desenvolvimento de Sistemas Disciplina: Introdução à Informática Assunto: Wordpress Professor: André Moraes Aluno: Bruna Lais Zuge Pelotas,
Informações sobre o Teleduc O TelEduc é um ambiente para a criação, participação e administração de cursos na Web. Ele foi concebido tendo como alvo o.
Projetando e Publicando Publicações Eletrônicas Interativas na World Wide Web Curso.
A Internet e Seu Impacto
Redes de comunicação A Internet e a Web
INTERNET BÁSICA.
Profª Angela Tissi Tracierra. É uma arquitetura de rede, onde existem dois módulos básicos na rede: o Servidor e os Clientes.
O que é a I N T E R N E T ? Prefeitura Municipal de Cachoeira do Sul Secretaria Municipal de Educação - SMEd NTM – Cachoeira do Sul Prof. Nilzo Machado.
Loja Online Smart Ecommerce completo, com layout responsivo
Engenhos de Busca Renato Marcelino de Oliveira. World Wide Web Existem centenas de milhões de paginas na web tratando de variados assuntos.
Buscadores na Web: um enfoque no Google.
A nova plataforma da Springer. The New SpringerLink Platform Nova URL: link.springer.com.
TUTORIAL. SABIN AMERICANA Esta base é formulada conforme a bibliografia de Joseph Sabin, bibliófilo americano que viveu entre 1821 e Com.
BASES DE DADOS Acesso e Uso.
CONHECENDO O. O que é o TelEduc O TelEduc é um ambiente para realização de cursos a distância através da Internet. Está sendo desenvolvido no Nied (Núcleo.
Interface da Base de Dados PubMed (Curso Básico: Módulo 4)
Evolução da Internet Introdução Internet Service Providers World Wide Web Protocolos Software para Internet A internet é uma rede de redes. A primeira.
Eliana Kátia Pupim Doutoranda em CI pela UNESP Marília.
NAVEGAÇÃO, PESQUISA NA INTERNET E SEGURANÇA NA REDE OBJETIVOS -NAVEGAR PELA INTERNET COM O SOFTWARE LIVRE DE NAVEGAÇÃO, ICEWEASEL, PREVENINDO-SE DE RISCOS.
Programa de Mestrado Profissional em Gestão da Informação Web Search Comunicação, Gestão e Organização do Conhecimento no Ciberespaço Profa. Dra. Silvana.
Tutorial Webnode Criando site 1. Registrando Acesse o endereço: e preencha os dados solicitados e clique em Registre-se e crie.
Transcrição da apresentação:

Busca de informação na Internet Augusto Vinhaes 12 de abril de 2017

Agenda 1) Internet ▪ Atividade:utilizar as ferramentas de busca ▪ Conceitos básicos ▪ Serviços ▪ World Wide Web ▪ Protocolo Http ▪ Website 2) Ferramentas de busca 3) Ferramentas de busca na Web ▪ Tipos 4) Diretórios ▪ Conceitos e características básicas ▪ Diferenças entre os diretórios: ▪ Princípios de organização ▪ Descrição dos sites ▪ Assuntos cobertos ▪ Atividade:utilizar as ferramentas de busca 5) Motores de busca ▪ Conceitos e características básicas ▪ Diferenças entre os motores: ▪ Tamanho da base de dados ▪ Critérios de indexação ▪ Critérios para inclusão de páginas ▪ Freqüência de atualização da base de dados ▪ Interfaces e recursos de busca ▪ Critérios de ordenação dos resultados 6) Diretórios ou motores de busca ? 7) Metamotores 8) Mecanismo de pesquisa personalizado Google

Internet ▪ Internet ▪ A Internet é considerada uma grande rede, ligando milhões de computadores de médio e grande porte (hosts) além de microcomputadores, através de linhas telefônicas comuns, linhas de comunicação privadas, cabos de fibra ótica, cabos submarinos, satélites e outros meios de comunicação. ▪ Os computadores que compõem a Internet podem estar localizados, por exemplo, em universidades, empresas, cooperativas, prefeituras, e nas próprias residências. ▪ Para o usuário, corresponde a um grupo de serviços disponíveis para troca de informações (Correio eletrônico, Ftp, Telnet, Chat, NewsGroup, WWW, Gopher, etc).

WWW e HTTP ▪ WWW (World Wide Web): é um dos serviços da Internet que corresponde a parte multimídia da mesma e que possibilita a exibição de páginas de hipertexto (documentos com textos, imagens, som, vídeo, programas, etc). É formada por milhões de páginas ou “locais” chamados sites. ▪ Http: é o protocolo que determina como acontece a comunicação no ambiente www, entre o computador que executa o navegador e o servidor que guarda a página.

Website ▪ Website ▪ Conjunto de páginas (webpages) agrupadas por um mesmo assunto, propósito ou objetivo, podendo ser de uma empresa ou indivíduo. ▪ Formado por páginas dinâmicas e/ou estáticas que podem ou não estar localizadas dentro de um mesmo servidor. ▪ Possue uma URL que possibilita sua localização. http://www.mct.gov.br = 200.130.9.36 1. HyperText Transfer Protocol: protocolo para transferência de páginas. 2. Indica que é uma página Web (visualizar imagens, textos, ouvir sons, etc). 3. Identificação da organização ou empresa. 4. Tipo de organização (.com - organização comercial, .edu - organização educacional, .org - organização sem fins-lucrativos, .gov - governo). 5. Identificação do país (.br, .fr, .us, etc).

Ferramentas de busca na Web ▪ Ferramentas de busca (search engines) ▪ Existem desde os primórdios da Internet e sua crição foi motivada pela necessidade de localização dos seus recursos informacionais. ▪ Archie – busca arquivos em repositórios de ftp (muito antiga). Veronica e Jughead – busca conteúdo nos Gophers. ▪ Ferramentas de busca na Web ▪ São Websites especializados em buscar e listar páginas da Internet a partir de informações (palavra-chave ou assunto) fornecidas pelo utilizador. ▪ Surgimento motivado pelo aparecimento da WWW.

Ferramentas de busca na Web ▪ São centenas de ferramentas e bilhões de páginas Html. ▪ Tipos ▪ Diretórios (catálogos por assunto) ▪ Motores de busca (índices) ▪ Metamotores (multibuscadores) ▪ A principal diferença é a forma como seus bancos de dados são compilados. ▪ Possuem características específicas que determinam o tipo, número e qualidade dos recursos recuperados, que podem variar enormemente. ▪ O entendimento das características de cada ferramenta aumenta a eficiência na procura dos recursos informacionais.

Ferramentas de busca na Web ▪ Diretórios ▪ Primeira solução para organizar e localizar os recursos da Web. ▪ Criado quando o conteúdo da Web era pequeno e permitia que fosse coletado de forma não automática. ▪ Os sites são organizados e classificados com a ajuda de editores em categorias e subcategorias (base de dados). ▪ Árvores hierárquicas de assunto com tópicos de interesse amplo (educação, esporte, entretenimento, viagens, compras, etc) para atender um público variado.

Ferramentas de busca na Web ▪ Diretórios ▪ Localização da informação: navegação nas categorias através do mouse e/ou busca via formulário e palavras-chave. ▪ Editores tomam conhecimento de novos sites através de sugestões de usuários, pesquisas na Internet (listas de anúncios de novas páginas) ou robôs. ▪ Sites coletados passam pela seleção de editores, o que pode indicar qualidade dos dados. ▪ Apenas os melhores recursos informacionais são escolhidos para inclusão. ▪ Necessidade de um grande número de editores (15.000 no caso do Open Directory da Netscape).

Ferramentas de busca na Web ▪ Diretórios ▪ Grandes diretórios podem conter dezenas de milhares de categorias e subcategorias. ▪ Alguns exemplos: ▪ 1º diretório da Web (nov. 1992): The World Wide Web Virtual Library (http://www.vlib.org) ▪ Open Directory (http://dmoz.org) ▪ Ipl2 (http://www.ipl.org/div/subject) ▪ Diretório do Google (http://www.google.com.br/dirhp?hl=pt-BR)

Ferramentas de busca na Web ▪ Principais diferenças entre os diretórios ▪ Referentes aos princípios de organização: ▪ A maioria usa listas hierárquicas de assunto, mas alguns usam esquemas tradicionais de classificação como a Classificação Decimal de Dewey (BUBL Link - http://bubl.ac.uk/link). ▪ Estes geralmente são mantidos por profissionais da informação ou bibliotecários, visando otimizar o acesso aos recursos da Web.

Ferramentas de busca na Web ▪ Principais diferenças entre os diretórios ▪ Referentes à descrição dos sites: ▪ Empresas comerciais incluem títulos e resumos de até 30 caracteres. ▪ Alguns se diferenciam por fornecer descrições criteriosas e detalhadas dos sites, podendo até incluir críticas e avaliações (diretórios avaliativos ou acadêmicos). ▪ Diretórios avaliativos ou acadêmicos: - Utilizam estudantes de mestrado em biblioteconomia ou ciência da informação e especialistas em assuntos específicos. - Associados a bibliotecas ou instituições de ensino. - Seleção mais rigorosa de sites e não inclui propaganda. Ex: Infomine (http://infomine.ucr.edu), Ipl2 (http://www.ipl.org/div/subject)

Ferramentas de busca na Web ▪ Principais diferenças entre os diretórios ▪ Referentes aos assuntos cobertos: ▪ Alguns diretórios são genéricos e cobrem todos os assuntos, mas outros cobrem áreas específicas (diretórios temáticos ou especializados). ▪ Diretórios temáticos: - Imagens, jornais, listas de discussão, ferramentas de busca, etc. - Assuntos específicos como saúde, ciências, legislação, etc. Ex: Informática: Criarweb (http://www.criarweb.com/diretorio) Bases de dados: CompletePlanet (http://aip.completeplanet.com) Website de bibliotecas: LibWeb (http://lists.webjunction.org/libweb)

Ferramentas de busca na Web ▪ Motores de busca ▪ Surgiram quando o número de recursos na Web adquiriu proporções que impediam a sua coleta manual e também a busca através de navegação. ▪ São formados por 4 componentes: um robô, que localiza e busca documentos na Web; um indexador, que extrai a informação dos documentos e constrói a base; o motor de busca propriamente dito; a interface, que é utilizada pelos usuários. ▪ Os robôs (spiders ou aranhas) vasculham a Internet em intervalos regulares (1 ou 2 meses) visitando sites, lendo seu conteúdo e seguindo seus links para outras páginas. ▪ Os documentos encontrados pelos robôs são encaminhados aos indexadores, que extraem a informação das páginas html e as armazenam em uma base de dados.

Ferramentas de busca na Web ▪ Motores de busca ▪ Localização da informação: ▪ Uma página Web é usada para efetuar a pesquisa na base de dados. ▪ O usuário formula a consulta através de combinações de palavras- chave, que é transmitida ao motor de busca propriamente dito. ▪ O programa (mb) localiza na base de dados os itens que devem constituir a resposta. ▪ O programa (mb) ordena os resultados colocando os mais relevantes em primeiro lugar na lista de resultados (descrição dos sites e links). ▪ Foco na abrangência das bases de dados, que podem alcançar centenas de milhões de ítens, e não na seletividade. ▪ O usuário pode sugerir sua URL ao invéz de esperar que o site seja encontrado pela varredura do robô (ou robôs trabalhando em paralelo).

Motor de busca genérico MB Motor de busca genérico

Ferramentas de busca na Web ▪ Motores de busca ▪ Motores de busca especializados em: ▪ Linguagem natural - True Knowledge (http://www.trueknowledge.com) ▪ Assunto / temáticos: Ask for Kids (http://www.askkids.com) Medical WorldSearch (http://www.mwsearch.com) FindSounds (http://www.findsounds.com) ▪ Alguns exemplos: ▪ Google (http://www.google.com.br) ▪ Yahoo (http://www.yahoo.com.br) ▪ Exalead (http://www.exalead.com/search)

Ferramentas de busca na Web ▪ Principais diferenças entre os motores de busca ▪ Referentes ao tamanho da base de dados: ▪ É medido em número de páginas da Web e importante para que a ferramenta seja considerada boa. As melhores contém cerca de 60% da Web. > 20 bilhões Fonte: Sullivan, Danny. Search Engine Size Wars V Erupts. [online] Disponível na Internet via www. URL: http://blog.searchenginewatch.com/blog/041111-084221. Arquivo capturado em 29 outubro 2007.

As bases de dados de cada motor não são iguais e para a mesma busca, cada ferramenta trará bons resultados que outras não acharam. Logo, para uma busca completa, há a necessidade de se usar mais de uma ferramenta. Fonte: Bondar, Serge. Search Engine Indexing Limits: Where Do the Bots Stop?. [online] Disponível na Internet via www. URL: http://http://articles.sitepoint.com/article/indexing-limits-where-bots-stop#. Arquivo capturado em 23 novembro 2009.

Ferramentas de busca na Web ▪ Principais diferenças entre os motores de busca ▪ Referentes aos critérios de indexação (inclusão da palavra no índice): ▪ O índice contém todos os termos que podem ser usados na busca de informações e a URL das páginas que os contém, dados sobre a posição das palavras na página e tags HTML. ▪ Existem vários critérios de indexação: - Inclusão de cada palavra do texto visível das páginas; - Inclusão das palavras que ocorrem com freqüência; - Inclusão de palavras e frases importantes contidas no título ou nos cabeçalhos e nas primeiras linhas; - Inclusão de termos que não fazem parte do texto visível: metatags de classificação, de descrição, de palavras-chave e texto ALT do tag Image. ▪ Um termo só será encontrado se estiver contido no índice. Logo, os critérios usados para encontrar os sites e indexá-los influenciam o resultado das buscas.

Ferramentas de busca na Web ▪ Principais diferenças entre os motores de busca ▪ Referentes aos critérios para inclusão de páginas: ▪ Determinam o número de itens nas bases de dados dos motores. ▪ Principais critérios: - Inclusão na base de todas ou a maioria das páginas de cada site; - Inclusão apenas da home page e algumas páginas principais; - Inclusão de mensagens de grupos de discussão, sites de ftp e gophers; ▪ Páginas que NÃO são incluídas nos motores de busca: - Sites que requerem senha de entrada ou páginas atrás do Firewall; - Páginas com o Metatag Meta Robot “noindex”; - Páginas isoladas (não referenciadas por outras páginas);

Ferramentas de busca na Web ▪ Principais diferenças entre os motores de busca ▪ Web invisível (web profunda ou deep web): - No passado: páginas com frames, image-maps e dinâmicas. - Atualmente: páginas geradas pelos sistemas de bancos de dados “on-the-fly”, como resultado de uma consulta específica - “Searchable databases”. A Web profunda é de 1000 a 2000 vezes maior que a web superficial (Bergman, 2001). Onde encontrar: em diretórios (Infomine, CompletePlanet) e via Google (buscar por health database ou base de dados saúde)

Ferramentas de busca na Web ▪ Principais diferenças entre os motores de busca ▪ Referentes à freqüência de atualização da base de dados: ▪ As bases de dados precisam ser atualizadas periodicamente para adicionar novas páginas, deletá-las ou incluir modificações das existentes. ▪ Cada motor tem sua própria estratégia e tecnologia. ▪ Principais estratégias: - Atualização completa da base pelo menos uma vez por mês; - Atualização semanal para páginas mais populares entre usuários e que mudam com freqüência; - Atualização diária de novas URLs e links mortos; ▪ Cada motor leva um tempo para adicionar na base uma página nova coletada pelo robô ou submetida pelo usuário. (meses) (pago 48h)

Ferramentas de busca na Web ▪ Principais diferenças entre os motores de busca ▪ Referentes as interfaces e recursos de busca: ▪ Dois modos de busca: - Simples (leigos - auxiliada por janelas e com conectivos booleanos inseridos automaticamente entre os termos); - Avançada (experientes - expressões booleanas complexas); ▪ Atenção: espaço será AND (Google e Yahoo) – cuidado com OR ! ▪ Outros recursos oferecidos: busca por frase, proximidade de palavras, sensibilidade à caixa de caracteres, domínio, tipo de arquivos, idioma. ▪ Como não existe padronização, recomenda-se: - Leitura das páginas de ajuda da ferramenta; - Consulta de tabelas comparativas em revistas especializadas ou na Internet. Site da biblioteca da University of California Berkeley

Ferramentas de busca na Web ▪ Principais diferenças entre os motores de busca ▪ Referentes aos critérios de ordenação dos resultados: ▪ Tem a finalidade de permitir que os melhores sites (mais relevantes) apareçam em primeiro lugar nos resultados mostrados. ▪ Para um mesmo número de resultados, a melhor ferramenta é aquela que traz itens mais relevantes entre os primeiros resultados. ▪ Os motores utilizam algorimos de ordenação de resultados com critérios tais como: - A localização e freqüência de ocorrência das palavras na página; - Freqüência de ocorrência das palavras e a proximidade delas; - Densidade com que um termo é usado em cada documento; - Páginas muito referenciadas em outros sites ou sites importantes; - Motores híbridos atribuem maior relevância aos sites de seu diretório ▪ Os algoritmos de ordenação por relevância são um dos maiores fatores diferenciais de competição entre os motores e não são revelados.

Ferramentas de busca na Web ▪ Atividade: utilizar as ferramentas de busca abaixo. ▪ Diretórios que utilizam listas hierárquicas de assunto: ▪ The World Wide Web Virtual Library (http://www.vlib.org) ▪ Open Directory (http://dmoz.org) ▪ Google (http://www.google.com.br/dirhp?hl=pt-BR) ▪ Diretórios que utilizam a CDD: BUBL Link (http://bubl.ac.uk/link) ▪ Diretórios avaliativos ou acadêmicos: Infomine (http://infomine.ucr.edu) Ipl2 (http://www.ipl.org/div/subject) ▪ Diretórios temáticos: Informática: Criarweb (http://www.criarweb.com/diretorio) Bases de dados: CompletePlanet (http://aip.completeplanet.com) Website de bibliotecas: LibWeb (http://lists.webjunction.org/libweb) ▪ Motores de busca genéricos: Google (http://www.google.com.br) Yahoo (http://www.yahoo.com.br) Exalead (http://www.exalead.com/search) ▪ Motores de busca especializados em: ▪ Linguagem natural: True Knowledge (http://www.trueknowledge.com) ▪ Assunto / temáticos: Ask for Kids (http://www.askkids.com) Medical WorldSearch (http://www.mwsearch.com) FindSounds (http://www.findsounds.com)

Ferramentas de busca na Web ▪ Diretórios ou motores de busca ? ▪ Existem diferenças importantes entre diretórios e motores de busca, o que gera vantagens e desvantagens associadas ao uso de cada um deles. ▪ Os diretórios tem bases de dados menores, mas com informação mais relevante. Exemplo: ▪ A procura por “search engines” no diretório do Yahoo, navegando por categoria, só encontra sites relevantes: dir.yahoo.com / Computers and Internet / Internet / World Wide Web / Searching the Web / Search Engines and Directories. ▪ O mesmo não acontece se procurarmos no motor de busca, que irá retornar milhões de resultados (muitos não relevantes).

Ferramentas de busca na Web ▪ Diretórios ou motores de busca ? ▪ Diretórios são mais apropriados para buscas por tópicos que sejam de interesse para um grande número de pessoas, pois provavelmente fazem parte da árvore hierárquica. ▪ Ou para tópicos muito amplos que retornariam um número elevado de respostas em um motor de busca. ▪ Motores de busca permitem a localização de qualquer tipo de informação, mesmo que específica, desde que exista na Internet e esteja indexada. ▪ Motores possuem bases de dados muito grandes (bilhões de páginas) e, por isso, pode-se recuperar muitos resultados não relacionados com os tópicos pesquisados (menor precisão).

Ferramentas de busca na Web ▪ Diretórios ou motores de busca ? ▪ Apesar dos motores possuírem grandes bases de dados, seus robôs podem não indexar alguns tipos de páginas que poderiam ser incluídas nos diretórios (Web invisível). ▪ As descrições dos sites obtidas nos diretórios é de melhor qualidade, já que são feitas manualmente. ▪ As descrições dos motores podem não conter informações adequadas, já que são elaboradas automaticamente pelos robôs. Robôs não conseguem identificar o tema central de um documento, detectar elementos importantes como gráficos ou imagens, extrair dados como autor, afiliação institucional ou data de publicação.

Ferramentas de busca na Web ▪ Diretórios ou motores de busca ? ▪ A pesquisa feita pelo diretório irá consultar apenas título, categoria e uma breve descriçao. A maioria dos motores proporciona pesquisa no texto integral dos documentos. Lembrar do page depth ▪ Atualmente a distinção entre diretórios e motores de busca não é tão nítida e a marioria das ferramentas pode ser considerada híbrida. ▪ Diretórios permitem buscas por palavras-chave em suas categorias, devido a dificuldade de navegação (grande número de sites); ▪ Motores tem incluído diretórios em suas páginas (Google e Yahoo). ▪ Diretórios tem feito parcerias com motores para “redirecionar” para eles, de forma automática e transparente, a pesquisa que não encontrou resultado.

Ferramentas de busca na Web ▪ Metamotores (multibuscadores) ▪ Seu surgimento foi motivado pelo fato de que melhores resultados em uma pesquisa são obtidos com o uso de várias ferramentas diferentes. ▪ Permitem a execução da busca em mais de uma ferramenta (diretórios ou motores) e exibem os resultados encontrados em uma só lista. ▪ Não possuem bases de dados e fornecem um “snapshot” dos resultados mais relevantes de várias ferramentas. ▪ Fazem um pré-processamento da consulta do usuário para prepará-la para submissão a cada ferramenta.

Ferramentas de busca na Web Metamotor genérico Ferramentas de busca na Web Motor de busca Convencional Metamotor

Ferramentas de busca na Web ▪ Metamotores (multibuscadores) ▪ Alguns exemplos: ▪ Mamma (http://www.mamma.com) ▪ Dogpile (http://www.dogpile.com) ▪ Metamotor com Clustering (agrupamento dos resultados em categorias): ▪ Carrot (http://search.carrot2.org/stable/search) ▪ Quintura (http://www.quintura.com) ▪ Existe também o software instalado no micro, que facilita a construção da estratégia de busca e contém ferramantas de apoio (eliminação de links duplicados e quebrados, ordenação dos resultados, armazenamento da busca, geração de relatórios, etc). ▪ Copernic (http://www.copernic.com)

Ferramentas de busca na Web ▪ Pseudometamotores: são interfaces para varias ferramentas, mas sem um mecanismo de busca integrada. As buscas são submetidas separadamente para cada ferramenta. ▪ InfoPeople (http://www.infopeople.org/search/tools.html) ▪ Algumas desvantagens dos metamotores: ▪ Os recursos de busca específicos de cada motor, usados para obter maior refinamento nas pesquisas, tornam-se inacessíveis. ▪ As buscas levam mais tempo porque é necessário processamento adicional para compilar os resultados obtidos e também porque o tempo de resposta final será o da ferramenta mais lenta. ▪ Quando usar: ▪ Quando não encontrar muitos resultados pesquisando em um só motor. ▪ Para determinar qual ferramenta traz as melhores respostas para uma determinada consulta e em buscas simples.

Ferramentas de busca na Web ▪ Atividade: utilizar as ferramentas de busca abaixo. ▪ Metamotores genéricos: ▪ Mamma (http://www.mamma.com) ▪ Dogpile (http://www.dogpile.com) ▪ Carrot (http://search.carrot2.org/stable/search) ▪ Quintura (http://www.quintura.com) ▪ Instalado no micro: Copernic (http://www.copernic.com) ▪ Pseudometamotores: InfoPeople (http://www.infopeople.org/search/tools.html)

Ferramentas de busca na Web ▪ Global Search Market Share Fonte: Search Engine Watch. Global search market share, July 2009 vs. July 2008. [online] Disponível na Internet via www. URL: http://searchenginewatch.com/3634922. Arquivo capturado em 24 novembro 2009.

Ferramentas de busca na Web ▪ Maior índice de criação de novas páginas aconteceu em 2007. ▪ De janeiro até abril de 2009, 46 milhões de novas páginas foram criadas. Fonte: Pavarin, Guilherme. Novos sites foram freados em 2008. [online] Disponível na Internet via www. URL: http://info.abril.com.br/noticias/internet/novos-sites-foram-freados-em-2008-08052009-37.shl. Arquivo capturado em 14 maio 2009.

Ferramentas de busca na Web ▪ Mais informações ▪ Ler a documentação da ferramenta que está disponível no próprio site e se manter atualizado, já que ela está em constante evolução. ▪ Obter informações também em sites que publicam artigos sobre as ferramentas e tabelas comparativas de características, como os abaixo: - Search Engine Watch (www.searchenginewatch.com). - Search Engine Showdown (www.searchengineshowdown.com). - About.com Web Search Guide (Websearch.about.com). - Site da Biblioteca da University of California Berkeley (http://www.lib.berkeley.edu).

Pesquisa personalizada Google ▪ Mecanismo de pesquisa personalizado Google ▪ Permite que você crie um mecanismo de busca para seu Website, Blog ou uma coleção de Websites. ▪ Alguns recursos interessantes: ▪ É possível pesquisar apenas o conteúdo de um Website ou um determinado tema (assunto). ▪ Podemos personalizar o box de pesquisa e a página de resultados, ajustar o ranking e convidar amigos para participar da construção do mecanismo. ▪ Pesquisa contextualizada - um ciclista pesquisando por “roda” em um mecanismo personalizado obterá somente resultados relevantes.

Pesquisa personalizada Google ▪ Gerenciamento dos “meus mecanismos de pesquisa”: http://www.google.com.br › Efetuar login > Configurações > Configurações da conta do google > Meus mecanismos de pesquisa ▪ Painel de controle ▪ Permite a modificação de um mecanismo de pesquisa já criado. Por ex: ▪ Retirar os links patrocinados ▪ Criar label de refinamento ▪ Configurar as keywords (ex: bikeonline) ▪ Estatísticas ▪ Permite a visualização das estatísticas de acesso e utilização do mecanismo de pesquisa e também as consultas realizadas pelos usuários.

Pesquisa personalizada Google ▪ Como o usuário acessa o mecanismo de pesquisa personalizado: ▪ Página inicial do mecanismo de pesquisa http://www.google.com/cse/home?cx=013530060800273303914:2p_g7ejlz1g ▪ Incluir o mecanismo de pesquisa na página inicial do iGoogle http://www.igoogle.com.br ▪ Incluir o box de pesquisa em um website: ▪ Food and Agriculture Organization › http://www.fao.org ▪ MacWorld › www.macworld.com

www.ensp.fiocruz.br/portal-ensp

www.ensp.fiocruz.br/portal-ensp

Referências ▪ REED, David. A Balanced Introduction to Computer Science. New Jersey: Prentice Hall, 2005. ▪ CENDON, Beatriz Valadares. Ferramentas de busca na Web. Ci. Inf. ,  Brasília,  v. 30,  n. 1, 2001 .  Disponível em: <http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0100- 19652001000100006&lng=pt&nrm=iso>. Acesso em: 01  Nov  2007. ▪ Bergman, Michael K.White Paper: The Deep Web: Surfacing Hidden Value. Journal of Electronic Publishing (JEP). v.7, n.1, aug.,  2001. Avaiable in: http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno= 3336451.0007.104. Access in: sep. 14, 2010.