Princípios da busca - PubMed
Princípios da busca em base de dados - Elaborando uma estratégia de busca no PubMed
Como citar
Pacheco RL, Martimbianco ALC, Riera, R. Princípios de busca em base de dados. 2022. Disponível em: www.nepsbeats.com.
A busca por evidências
Saber realizar uma busca eficiente em base de dados é fundamental para qualquer tomador de decisão. Afinal, se você deseja utilizar as melhores evidências científicas para tomar a sua decisão, você precisa primeiro encontrá-las.
No entanto, encontrar evidências não é tão simples. A figura 1 mostra a evolução anual de referências que foram recuperadas no Medline com um filtro para identificar revisões sistemáticas.
Figura 1. Referências recuperadas ao longo dos anos com filtro para identificar revisões sistemáticas no Medline
Como podemos notar, a quantidade de estudos recuperados é enorme. Para lidar com isso, precisamos de formas de especificar nossas estratégias de busca, para reduzir a quantidade de referências recuperadas.
Construindo uma estratégia de busca
Para construirmos uma estratégia de busca, podemos seguir os seguintes passos:
- Definir o contexto da busca (contexto científico de uma revisão sistemática ou prática do dia a dia)
- Definir a pergunta de interesse em um acrônimo estruturado (por exemplo, o PICO)
- Identificar os termos a serem utilizados para cada linha da pergunta a ser utilizada
- Conectar os termos com operadores booleanos
- “Rodar” a busca e checar por inconsistências
- Aplicar filtros adicionais, se necessário.
- Traduzir a estratégia de busca para outras bases
Se você vai buscar em mais de uma de uma base de dados eletrônica, recomenda-se iniciar sempre pela busca do Medline pois é a base mais estruturada e mais fácil de identificar termos e filtros relevantes.
1. A importância do contexto: sensibilidade x especificidade
Podemos reduzir a quantidade de referências recuperadas em uma base de dados especificando nossa estratégia de busca.
No entanto, especificar uma estratégia vem com um preço: você corre mais risco de perder alguma referência relevante.
Quanto mais sensível for a busca, maior a quantidade de referências recuperadas e menor o risco de perder uma referência relevante. Quanto mais específica for a busca, menor a quantidade de referências recuperadas e maior o risco de perder uma referência relevante.
Toda vez que iremos fazer uma estratégia de busca, precisamos encontrar um equilíbrio entre a sensibilidade e especificidade adequada da busca, que irá se adequar ao contexto em que estamos.
Por exemplo, se o objetivo é construir uma estratégia de busca para conduzir uma revisão sistemática, talvez uma busca mais sensível seja o adequado para reduzir a probabilidade de perdermos estudos potencialmente elegíveis.
Por outro lado, para responder uma pergunta clínica do dia a dia, é possível iniciar o processo de busca com uma estratégia mais específica e sensibilizar a busca se necessário.
2. Definindo a pergunta de interesse
É sempre prudente construir uma estratégia de busca com base na pergunta estruturada que você quer responder. Por exemplo, podemos utilizar o acrônimo PICO para uma pergunta de intervenção.
- P (Participantes)
- I (Intervenção)
- C (Comparador)
- O (Outcomes, desfechos)
Quanto mais “linhas” do acrônimo utilizarmos, mais específica será a busca.
Uma busca extremamente sensível seria utilizar apenas termos referentes a uma das linhas, por exemplo termos relacionados à intervenção. De fato, a busca mais sensível possível seria não utilizar linha nenhuma da pergunta: deste modo, iremos buscar na base inteira, o que seria inviável do ponto de vista prático.
3. Identificando termos a serem utilizados em cada linha da pergunta estruturada
Vamos imaginar que desejamos estruturar uma busca para identificar estudos que avaliaram a efetividade do modafinil em pacientes com acidente vascular cerebral. Precisamos começar a coletar termos que iremos adicionar na busca. Vamos começar usando apenas a linha da população e da intervenção, pois quase sempre a busca é sensível o suficiente com apenas essas duas linhas (em uma revisão sistemática, quase sempre se utiliza apenas essas duas linhas). Se necessário, pode-se adicionar termos de comparador ou desfechos.
Podemos coletar os termos com base no nosso conhecimento próprio, mas podem existir sinônimos para cada um dos termos.
Por exemplo, acidente vascular cerebral não é a única forma que as pessoas podem se referir a esta doença. Por exemplo, sangramento intracerebral pode ser um termo sinônimo e assim por diante.
O Mesh database (figura 2) é uma base de dados que pode ser utilizada para identificação de sinônimos.
Figura 2. Acessando o Mesh database
A figura 3 indica o processo da nossa busca. Iremos buscar o termo stroke para identificar sinônimos.
Figura 3. Iniciando busca por sinônimos no Mesh database
A figura 4 mostra o resultado da busca. Iremos ler as descrições e ver se o termo apresentado de fato se relaciona com o que estamos querendo buscar. Podemos ver que o primeiro resultado já se trata de acidente vascular cerebral da forma como desejamos buscar.
Figura 4. Termos identificado após busca no Mesh database
Vale lembrar que nem sempre um termo será encontrado no Mesh database, neste caso, devemos buscar sinônimos de outra forma.
A figura 5 apresenta a página final. O resultado tem o termo principal e abaixo, os “Entry terms” que são todos termos considerados como sinônimos do termo principal.
Figura 5. Página do termo no Mesh database
A seta azul indica o termo principal, que sempre deve ser adicionado na lista.
A seta amarela indica a lista de sinônimos que podem ser adicionados na nossa estratégia de busca.
A seta vermelha indica a transformação do termo Mesh indexado. Mas afinal, o que é o “Mesh”?.
O Medline faz um processo de indexação manual (feita por humanos!) de todos os artigos que irão ser disponibilizados na sua base de dados.
Este processo é similar a uma etiquetação dos artigos. Ou seja, ao indexar um artigo, alguém irá ler e entender que aquele artigo se encaixa na definição de “stroke”, e o artigo irá ganhar uma “etiqueta”, que pode ser buscada da seguinte forma: “Stroke”[Mesh].
Toda vez que você buscar por “Stroke”[Mesh] no Medline, você está buscando artigos que foram “etiquetados” por alguém que julgou que ele estava relacionado com a definição e termos sinônimos da entrada “Stroke” do Mesh database.
Em uma busca para o dia-a-dia, talvez seja suficiente buscar apenas usando o Mesh. No entanto, em uma busca mais sensível, principalmente em uma revisão sistemática, adicionamos o Mesh e termos livres pois o processo de indexação não é perfeito (afinal, ele é feito por humanos, que nem sempre são da área do artigo que estão indexando). Por isso, fazemos a busca de maneira redundante, buscando pelo Mesh e por qualquer sinônimo que acharmos necessário.
A figura 6 mostra os termos extraídos da página do Mesh database (figura 5). Recomendamos utilizar o bloco de notas para organizar os termos identificados.
Figura 6. Termos identificados para a linha de P(participantes)
Agora, iremos repetir o processo e identificar os termos para a intervenção para identificar os termos sinônimos do modafinil (figura 7)
Figura 7. Termos identificados para a linha da I(intervenção)
4. Conectar os termos com operadores booleanos
Após a identificação dos termos que utilizaremos na busca, precisamos conectá-los de maneira lógica para estruturar nossa estratégia. Para isso, utilizaremos os operadores booleanos.
Quase sempre, utilizaremos apenas dois operadores booleanos: OR e AND. Nota-se que estes termos sempre devem ser usados em maiúsculo.
O OR é utilizado para somar termos sinônimos. Quando buscamos por (stroke) OR (cerebrovascular acident), queremos identificar artigos que utilizaram um OU outro termo.
O AND é utilizado para identificarmos artigos que utilizaram um E outro termo. Quase sempre utilizaremos AND para cruzar linhas diferentes do nosso PICO. Quando buscamos (stroke) AND (modafinil), queremos identificar artigos que obrigatoriamente utilizaram os dois termos.
Neste estágio, também é preciso delimitar cada um dos termos identificados para não haver problemas de entendimento da base com termos compostos.
Por exemplo, os seguintes termos são compostos (mais de uma palavra):
Acute Stroke
Cerebrovascular Accident
Para combinarmos eles, podemos usar parênteses ou aspas como delimitador.
Os parênteses sensibilizam mais a busca, no sentido que ele pode permutar palavras dentro do mesmo termo. Ou seja, quando utilizamos (Cerebrovascular Accident) ele irá buscar estas palavras em qualquer ordem que possam ter sido utilizadas, por exemplo, Accident Cerebrovascular.
Ao utilizar aspas, não há permutação de palavras. O termo “Cerebrovascular Accident” irá buscar estas duas palavras nesta ordem.
De modo geral, para uma busca mais sensível o ideal é utilizar parênteses. A figura 8 demonstra o quão mais sensível o uso de parênteses pode ser. Com aspas, apenas 366 referências foram recuperadas em comparação a 413,523 com parênteses.
Figura 8. Comparação entre uso de aspas e parênteses em uma estratégia de busca
Alguns termos complexos que já possuem parênteses em sua composição ou que possuem números devem ser delimitados com aspas, como por exemplo os seguintes termos:
2-(Benzhydrylsulfinyl)acetamide
2-((R)-(Diphenylmethyl)sulfinyl)acetamide
Utilizaríamos eles assim: “2-(Benzhydrylsulfinyl)acetamide” OR “2-((R)-(Diphenylmethyl)sulfinyl)acetamide”.
Termos simples, que possuem apenas uma palavra não precisam ser delimitados por parênteses ou aspas. No entanto, por consistência da busca, as vezes colocamos todos os termos entre parênteses apenas para não perder nada (com exceção dos termos complexos que usamos aspas).
Com isto em mente, podemos prosseguir pela delimitação e combinação dos termos utilizando os operadores booleanos (figura 9).
Figura 9. Delimitação e combinação de termos
5. “Rodar” a busca e checar por inconsistências
Com os termos identificados e conectados, podemos ir para a aba de busca avançada no PubMed (figura 10).
Figura 10. Aba de busca avançada no PubMed
A figura 11 demonstra o passo inicial para “rodarmos” a busca no Medline.
Figura 11. Primeiro passo da estruturação de busca no PubMed.
O primeiro passo é transferir (copiar e colar, Ctrl+c / Ctrl+v) a busca do bloco de notas no campo “Enter a Search term” (seta azul). Ou seja, apenas adicionar na mesma linha termos combinados por OR. Depois, devemos adicionar a busca no query box (seta laranja), como demonstrado na figura 11
O segundo passo é transferir a busca do query box para o histórico (seta vermelha) (figura 12). Depois, repetimos o processo adicionando as outras linhas. Lembrar de adicionar no histórico apenas uma linha por vez.
Figura 12. Segundo passo da estruturação de busca no PubMed.
Após adicionarmos todas as linhas relevantes no histórico, podemos cruzar as linhas manualmente no Query box usando # para recuperar cada linha do histórico.
A figura 13 demonstra as linhas do P e I adicionadas no histórico (setas azuis) e a expressão #1 AND #2 digitada no query box (seta vermelha). Estamos pedindo para a base cruzar os termos da linha 1 com os da linha 2 usando o operador booleano AND. Isto significa que queremos buscar artigos que tenham pelo menos um termo da linha 1 E pelo menos um termo da linha 2.
Figura 13. Terceiro passo da estruturação de busca no PubMed.
Vale notar alguns alertas que a base emitiu. Podemos clicar em “Details” para identificar o que aconteceu. Neste caso, alguns termos utilizados não recuperaram nenhuma referência, o que não impacta nossa busca. No entanto, as vezes os alertas podem identificar problemas maiores que impactam nossa estratégia, como o uso de alguns parênteses ou operador booleano inadequado.
A figura 14 mostra o histórico com a linha 3 adicionada. Nota-se que 46 referências foram identificadas com nossa estratégia de busca, podemos acessá-las clinicando no número (seta azul).
Figura 14. Busca estruturada final
A figura 15 apresenta as referências recuperadas com a estratégia de busca elaborada.
Figura 15. Referências recuperadas pela estratégia de busca
6. Aplicar filtros adicionais, se necessário.
Filtros nada mais são que linhas adicionais em uma estratégia de busca que tem como objetivo identificar referências com alguma característica especial: tipo de estudo, idioma, data de publicação, e etc.
Para uma busca do dia-a-dia, podemos usar diversos filtros para especificar nossas buscas. Em uma revisão sistemática geralmente utilizamos apenas filtros validados de desenho de estudo e raramente filtros de data de publicação (filtros de data são usados comumente para atualizar uma revisão sistemática).
Neste link (https://pubmed.ncbi.nlm.nih.gov/help/#help-filters) , pode-se encontrar diversos filtros que podem ser aplicados em uma busca no PubMed.
6.1 Filtros por desenho de estudo
Nesta página, mantemos atualizado diversos filtros validados para identificar diferentes tipos de desenho de estudo em diversas bases de dados.
Os principais filtros do PubMed são oferecidos pela própria base. O “Clinical Queries” ( https://pubmed.ncbi.nlm.nih.gov/clinical/ ) é uma ferramenta que disponibiliza diversos filtros. Mais informações sobre a sensibilidade e especificidade de cada filtro estão disponíveis neste link (https://pubmed.ncbi.nlm.nih.gov/help/#clinical-study-category-filters).
Iremos adicionar o filtro a seguir do Clinical Queries para recuperar ensaios clínicos randomizados. Este filtro possui sensibilidade de 99% e especificidade de 70%. Ou seja, é um filtro muito sensível para recuperar ensaios clínicos randomizados.
((clinical[Title/Abstract] AND trial[Title/Abstract]) OR clinical trials as topic[MeSH Terms] OR clinical trial[Publication Type] OR random*[Title/Abstract] OR random allocation[MeSH Terms] OR therapeutic use[MeSH Subheading])
A figura 16 apresenta a busca original (figura 15) com a incorporação do filtro de ensaios clínicos randomizados. Podemos notar que o número de referências diminui de 46 para 31.
Figura 16. Aplicação de filtro sensível para recuperar ensaios clínicos randomizados
Outro filtro importante do PubMed (apresentado a seguir) foi desenvolvido para recuperar revisões sistemáticas.
(((systematic review[ti] OR systematic literature review[ti] OR systematic scoping review[ti] OR systematic narrative review[ti] OR systematic qualitative review[ti] OR systematic evidence review[ti] OR systematic quantitative review[ti] OR systematic meta-review[ti] OR systematic critical review[ti] OR systematic mixed studies review[ti] OR systematic mapping review[ti] OR systematic cochrane review[ti] OR systematic search and review[ti] OR systematic integrative review[ti]) NOT comment[pt] NOT (protocol[ti] OR protocols[ti])) NOT MEDLINE [subset]) OR (Cochrane Database Syst Rev[ta] AND review[pt]) OR systematic review[pt]
Para este filtro em especial, ele pode ser acessado por um atalho: systematic[sb].
A figura 17 apresenta a busca com aplicação do filtro para recuperar revisões sistemáticas.
Figura 17. Aplicação de filtro para recuperar revisões sistemáticas
6.2 Filtros de data
As figuras 18, 19 e 20 apresentam a aplicação de filtro de data na interface de busca avançada no PubMed.
Figura 18. Primeiro passo para aplicar filtro de data no PubMed
Figura 19. Segundo passo para aplicar filtro de data no PubMed
Figura 20. Terceiro passo para aplicar filtro de data no PubMed
A figura 21 apresenta o resultado da busca com aplicação de filtro de data de publicação de primeiro de janeiro de 2020 (2020/01/01) até o momento presente (data da busca).
Figura 21. Resultado da busca com aplicação de filtro de data de publicação
Vale ressaltar que o PubMed possui filtros laterais na sua interface de resultados, como demonstrado na figura 22. Os filtros laterais podem ser utilizados para uma busca no dia a dia. No entanto, em uma revisão sistemática, é imperativo adicionar os filtros na estratégia de busca manualmente para deixar a busca transparente e reprodutível.
Figura 22. Filtros laterais do PubMed
7. Tradução da estratégia de busca para outras bases
Nesta página mantemos atualizado uma lista com diversas bases de dados que podem ser utilizadas.
Como o PubMed geralmente é a base principal de toda busca de evidências, recomendamos iniciar a elaboração da estratégia por ele.
Cada base possui uma lógica e ferramentas diferentes para elaboração de estratégias de busca avançadas. Algumas possuem outro sistema de vocabulário controlado, como o MeSH. Outras, utilizam o MeSH ou não possuem nenhum sistema de vocabulário controlado.
Deste modo, se precisar buscar em alguma base que não tenha familiaridade, procure sempre em páginas de ajuda ou “FAQ” da própria base para orientação sobre como elaborar e executar a estratégia de busca.