Cadastro de documentos: a importância do controle de vocabulário para eficiência na busca e recuperação
Escrito por Camila Denículi Vila Verde – Sócia fundadora e consultora da empresa Doc Expert
Com o advento da tecnologia, a ordenação física deixa de ser o principal método de organização de documentos e dá lugar à indexação. Através do cadastro e descrição dos documentos em sistemas de gestão eletrônica, é possível extrair de seus conteúdos as principais informações para indexá-las e torná-las pesquisáveis, fazendo com que a recuperação e uso dos documentos sejam mais rápidos e fáceis. Também é possível categorizá-los com informações não explícitas em seus conteúdos, tais como o tipo documental ou a disciplina a qual pertencem, por exemplo.
Entretanto, para que o cadastro de documentos gere índices de pesquisa eficientes, é preciso controlar o vocabulário a ser utilizado ANTES de descrever e cadastrar o acervo nos sistemas eletrônicos. A escolha das palavras descritoras deve considerar uma proximidade com o público que irá usá-las para recuperar os documentos, e por isso não existe um vocabulário padrão, aplicável a qualquer situação, ele deve ser criado e trabalhado caso a caso, e ser atualizado sempre que necessário. Além de definir as palavras que serão usadas é preciso criar remissivas, ou seja, relacionar palavras sinônimas que podem ser usadas por diferentes usuários que devem levar aos mesmos resultados de busca.
Para ilustrar a necessidade do vocabulário controlado, imagine que uma empresa possui um acervo documental de 300 itens sobre a cidade de São Paulo. Ao cadastrar estes documentos no sistema, cada funcionário usou uma palavra diferente para descrever os documentos. Ao final dos trabalhos, 200 itens ficaram indexados como “São Paulo”, 75 como “SP” e outros 25 como “S.P”, como mostra a figura ao lado. Ou seja, para recuperar o universo de 300 documentos sobre São Paulo, cadastrados no sistema, uma pessoa teria que fazer 3 pesquisas distintas e isso acaba não sendo feito, comprometendo o uso de todas as informações disponíveis no acervo documental sobre o assunto pesquisado.
Através da definição de vocabulário controlado, elege-se a palavra mais “correta” para descrever o documento, criando uma tabela fechada que não permite ao cadastrador digitar livremente a informação para descrever o documento. Cada palavra constante desta tabela é correlacionada com palavras sinônimas, fazendo com que a pesquisa remeta qualquer palavra pesquisada pelo usuário aos mesmos resultados de busca. No exemplo citado acima, o vocabulário controlado teria “São Paulo” como termo principal e “SP” e “S.P” como remissivas. Assim, no momento da pesquisa qualquer um destes 3 termos retornaria os 300 resultados de busca.
Portanto conclui-se que a falta de definição de vocabulário controlado ou a criação de um vocabulário mal estruturado pode prejudicar e comprometer a recuperação de documentos e uso de informações, dificultando ou impedindo a realização de trabalhos e tomadas de decisões, dentro das empresas. A construção destes vocabulários deve ser bem planejada e conduzida, com envolvimento tanto da equipe que cadastra como do público que pesquisa. As empresas devem buscar profissionais da informação, que são capacitados e qualificados, para estabelecer metodologias eficientes para construir e manter estes vocabulários, dentro das empresas.