News Crawler

Agregador de Notícias e Bot Telegram


Sofia - Bot criado para Telegram 
(Nome da gata de rua que adotei há alguns anos.)
A gata "Sofia"


Há um tempo atrás havia tentado escrever um crawler de notícias bem simples para capturar as principais noticias da página inicial de três grandes portais de notícias brasileiros. Havia usado a linguagem Python e o ambiente do Jupyter Lab para criar de modo interativo o código e fazendo anotações sobre o código.


Por esses dias senti vontade de voltar ao código e fiz algumas alterações no arquivo do jupyter lab e inclui pequenas funções para salvar lista dos links das notícias. Após isso isolei o código em um pequeno módulo e criei um bot para o Telegram que permitia postar as notícias das atualizações dos portais em um canal no Telegram.


O código é simples e usa módulos Python como “Resquests” e “BeaultifulSoup” para acessar as páginas e pegar o html do site extraindo assim conteúdo como titulo e link das notícias da página inicial.


Nota: O bot acima mencionado usa API do Telegram para fins didaticos e utiliza-se do módulo news-crawler que é um agregador de notícias de portais veiculos de comunicação e jornalismo sérios. Assim o mesmo dentro da leis nacionais e normas da plataforma não serve-se e nem propõe-se para divulgação de notícias falsas (fake news) .

Deixo abaixo o link para o código no Github.

www.github.com/wsricardo/news-crawler


Para saber como apoiar este blog visite a página "Apoie"

Agradece,

Wandeson Ricardo




Nenhum comentário:

Postar um comentário