A apresentação está carregando. Por favor, espere

A apresentação está carregando. Por favor, espere

Programa de Mestrado Profissional em Gestão da Informação Web Search Comunicação, Gestão e Organização do Conhecimento no Ciberespaço Profa. Dra. Silvana.

Apresentações semelhantes


Apresentação em tema: "Programa de Mestrado Profissional em Gestão da Informação Web Search Comunicação, Gestão e Organização do Conhecimento no Ciberespaço Profa. Dra. Silvana."— Transcrição da apresentação:

1 Programa de Mestrado Profissional em Gestão da Informação Web Search Comunicação, Gestão e Organização do Conhecimento no Ciberespaço Profa. Dra. Silvana Drumond Monteiro Discentes: Sergio Hiroshi Manabe e Zuleika Rodrigues Ramos Frari

2 Web Search zDesde os primórdios da Internet, houve a preocupação de se criarem ferramentas para localização de seus recursos informacionais zExistem dois tipos básicos de ferramentas de busca na Web: zDiretórios zWeb search ou motores de busca

3 Diretórios por assunto zPrecederam aos programas de busca e foram criados quando ainda era possível coletar as informações manualmente zAs informações eram acrescentadas aos bancos de dados com breve descrição.

4 Diretórios por assunto zAs informações são organizadas hierarquicamente em categoria temática e sub-categorias. Os mais populares diretórios são o Yahoo, Lycos, Cade?, Achei. zO método utilizado era de pesquisa por editores que selecionavam as informações de interesse zInclusão se dava por solicitação do autor interessado em ter seu site divulgado, que poderia ou não ser aceita a sua inclusão zExemplo do Yahoo: Ciência » Animais, insetos e bichos de estimação » Vida aquática » Peixes » Espécies » Tubarões

5 Web Search zNão organizam hierarquicamente as páginas que colecionam. Não se preocupam com a seletividade, mas com a abrangência de suas bases de dados, procurando colecionar o maior número possível de recursos através do uso de softwares chamados robôs zcomeçaram a surgir quando o número de recursos na Web adquiriu proporções tais que impediam a sua coleta por meios manuais e a busca apenas através da navegação zOs programas de busca são mais abrangentes que os catálogos uma vez que os robôs registram toda a informação encontrada. Fornecem, portanto, uma visão mais ampla do conteúdo disponível na Internet sobre um assunto

6 Web Search zTodos os motores atuais utilizam o método de robôs sendo formados por quatro componentes: z1. um robô, que localiza e busca documentos na Web z2. um indexador, que extrai a informação dos documentos e constrói a base de dados z3. o motor de busca propriamente dito z4. a interface, que é utilizada pelos usuários

7 1. Robôs zsão programas que o computador hospedeiro da ferramenta de busca lança regularmente na Internet, na tentativa de obter dados sobre o maior número possível de documentos para integrá-los, posteriormente, à sua base de dados. zpara se locomoverem de um documento a outro se utilizam dos links existentes nas páginas da Web. Iniciam a busca em sites conhecidos, recuperam a sua home page e, sistematicamente, seguem os links encontrados nesta página inicial.

8 1. Robôs zUsam algoritmos próprios para determinar que links devem seguir: zAbordagem breadth-first: recuperam os documentos da hierarquia superior de um grande número de servidores zAbordagem depth-first: capturam todos os documentos em links de um mesmo servidor

9 2. Indexadores zOs documentos encontrados pelos robôs são encaminhados aos indexadores que extraem a informação das páginas HTML e as armazenam em uma base de dados zEsta base de dados do motor de busca consiste de informações julgadas importantes como os URLs ou endereços das páginas HTML, títulos, resumos, tamanho e as palavras contidas nos documentos

10 3. Motores de busca zOs motores de busca podem usar vários robôs que trabalham em paralelo para construir sua base de dados zNa coleta de páginas para suas bases de dados, a maioria dos motores de busca permite também que os usuários sugiram URLs, em vez de esperar que os documentos sejam encontrados através da varredura realizada regularmente pelos robôs.

11 4. Interface zA interface, normalmente uma página Web, é utilizada pelos usuários para efetuar a pesquisa na base de dados zFornece meios para o usuário formular a sua consulta, que é recebida e transmitida para o software de busca ou motor de busca propriamente dito zO programa localiza, entre os milhões de itens na base de dados, aqueles que devem constituir a resposta. Também ordena os resultados, apresentando descrições de sites e seus links

12 Refinamentos zOs programas de busca são mais abrangentes que os catálogos uma vez que os robôs registram toda a informação encontrada. Assim, por terem bancos de dados com milhões de páginas, a busca pode ser mais imprecisa, retornando um grande número de respostas insatisfatórias. zRefinamentos são comandos que permitem limitar e controlar a ação das ferramentas de busca.

13 Estratégias de busca

14

15 Refinamentos (*) URL: cada página de um site tem um endereço único denominado Uniform Resource Locator (URL) que possibilita sua localização por computadores no mundo todo. Por exemplo, a URL http://www.uel.br identifica a página inicial do site da UEL

16 Estratégias de busca zEstratégias não recomendadas: zExploração de catálogos. Recuperar documentos tentando combinar o assunto pesquisado com a categoria mais geral de uma hierarquia de assuntos. A partir daí, o usuário escolhe subcategorias que possam levá-lo ao objetivo pretendido. A principal dificuldade consiste em determinar sob qual categoria o assunto está classificado zPalavras-chave simples nos programas de busca: Pesquisar com palavras-chave simples é buscar uma ou mais palavras, separadas por espaços, nas ferramentas de busca. Tal procedimento gera excesso de documentos sendo que, grande parte deles não têm são relevantes

17 Estratégias de busca zEstratégias não recomendadas: zExploração de catálogos. Recuperar documentos tentando combinar o assunto pesquisado com a categoria mais geral de uma hierarquia de assuntos. A partir daí, o usuário escolhe subcategorias que possam levá-lo ao objetivo pretendido. A principal dificuldade consiste em determinar sob qual categoria o assunto está classificado zPalavras-chave simples nos programas de busca: Pesquisar com palavras-chave simples é buscar uma ou mais palavras, separadas por espaços, nas ferramentas de busca. Tal procedimento gera excesso de documentos sendo que, grande parte deles não têm são relevantes

18 O mundo é plano - Friedman z Força n.9 In-Formação z Google, Yahoo!, MSN Web Search z São considerados uma força niveladora devido à ideia de que todo o conhecimento do mundo está ao alcance de todos a qualquer momento em qualquer lugar. z O autor chama de IN-FORMAÇAO, porque o usuário tem a possibilidade de construir e estruturar sua cadeia de conhecimento pessoal, informação e entretenimento.

19 Bibliografia FRIEDMAN, Thomas L. O mundo é plano: uma breve história do século XXI. Rio de Janeiro, Ed. Objetiva, 2005. 471p. BRANSKI, Regina M. Recuperação de informações na Web. Perspectivas em Ciência da Informação. Belo Horizonte – MG, v. 9, n. 1, jan./jun. 2004 CENDÓN, Beatriz Valadares. Ferramenta de busca na Web. Ciência da Informação. Brasília - DF, v. 30, n. 1, p. 39-49, jan./abr. 2001.


Carregar ppt "Programa de Mestrado Profissional em Gestão da Informação Web Search Comunicação, Gestão e Organização do Conhecimento no Ciberespaço Profa. Dra. Silvana."

Apresentações semelhantes


Anúncios Google