Dados De Notícias Estruturados
Nossa API structured news data fornece uma maneira simples de acessar artigos de notícias de todo o mundo. Nós fornecemos uma API simples, consistente e fácil de usar para acessar artigos de notícias de milhares de fontes.
title
O título do artigo de notícias.
href
O URL do artigo de notícias.
description
Uma descrição do artigo de notícias.
body
O conteúdo completo do artigo de notícias.
published_at
Data em que o artigo foi publicado.
image
A imagem do artigo de notícias.
língua
A língua do artigo noticioso.
Categoria
A categoria do artigo de notícias.
topic
O tema do artigo de notícias.
industry
A indústria do artigo de notícias.
sentimento
O sentimento do artigo de notícias.
🔥 story
Agrupe os artigos em histórias.
Fonte
Informações da fonte do artigo.
🔥 esta_quebrando
Detecção de notícias de última hora.
is_duplicate
Detecção de duplicados.
is_paywall
Detecção de Paywall.
links
Os links do artigo de notícias.
media
A mídia do artigo de notícias.
hashtags
As hashtags do artigo de notícias.
read_time
O tempo estimado para ler o artigo em minutos.
sentences_count
O número de frases no artigo.
contagem_de_parágrafos
O número de parágrafos do artigo.
words_count
O número de palavras no artigo.
characters_count
O número de caracteres no artigo.
Perguntas frequentes
- Cada artigo inclui campos principais (título, descrição, corpo, URL, data de publicação, imagem) além de dados enriquecidos: análise de sentimento, categoria, tópico, classificação de indústria, idioma, informações de origem com ranking do publicador, ID de agrupamento de histórias e métricas de conteúdo como contagem de palavras e tempo de leitura. Também extraímos entidades, hashtags, links e mídia do conteúdo do artigo.
- Nossa análise de sentimento usa modelos de NLP treinados em conteúdo de notícias para classificar artigos como positivos, negativos ou neutros. Cada artigo recebe uma pontuação de polaridade e um nível de confiança. O modelo analisa o texto completo do artigo, não apenas manchetes, alcançando alta precisão em mais de 50 idiomas. Você pode filtrar resultados de pesquisa por sentimento para encontrar tons emocionais específicos.
- O agrupamento de histórias agrupa artigos relacionados que cobrem o mesmo evento ou tópico. Quando múltiplos editores relatam a mesma notícia, atribuímos a eles o mesmo ID de história. Isso ajuda você a acompanhar como as histórias se desenvolvem ao longo do tempo, identificar tópicos em tendência, medir a amplitude da cobertura e evitar processar conteúdo duplicado de diferentes fontes.
- Nosso algoritmo de detecção de duplicatas analisa o conteúdo do artigo, entidades e tempo de publicação para identificar quando múltiplos editores cobrem a mesma história. Cada artigo tem uma flag is_duplicate. Isso ajuda a filtrar conteúdo redundante e focar em notícias únicas. Combinado com o agrupamento de histórias, você pode obter um artigo por história ou rastrear a cobertura completa.
- APITube suporta múltiplos formatos de exportação: JSON (padrão), CSV, TSV, XLSX (Excel), XML e feeds RSS. Todos os formatos incluem os mesmos campos de dados. Escolha o formato que melhor se adapta ao seu fluxo de trabalho - JSON para APIs, CSV/XLSX para planilhas e ferramentas de BI, RSS para leitores de feed, XML para sistemas legados.
- Classificação do publicador (OPR - Overall Publisher Rank) é pontuada de 0-10 com base em múltiplos fatores: autoridade de domínio, volume de tráfego, qualidade de conteúdo, frequência de publicação e padrões editoriais. Fontes de classificação mais alta (6 ) geralmente incluem grandes veículos de notícias como Reuters, BBC, NYT. Use este filtro para priorizar fontes autorizadas ou excluir conteúdo de baixa qualidade.
- Nosso NER (Reconhecimento de Entidades Nomeadas) extrai pessoas, organizações, locais, marcas, eventos e mais do texto do artigo. Cada entidade inclui seu tipo e contagem de menções. Use dados de entidades para monitoramento de marca, rastreamento de empresas específicas, análise de cobertura geográfica ou construção de grafos de conhecimento a partir de conteúdo de notícias.
- A API retorna ambos os campos: descrição (resumo/excerto) e corpo (texto completo do artigo). O campo de corpo contém o conteúdo do artigo completamente limpo com HTML removido. Alguns artigos por trás de paywall podem ter conteúdo de corpo limitado - verifique a flag is_paywall. Acesso ao corpo completo está incluído em todos os planos, sem custo adicional.
API de Dados de Notícias Estruturados: Além dos Artigos Brutos
APITube fornece dados de notícias estruturados com esquemas consistentes em mais de 500.000 fontes. Cada artigo inclui campos normalizados: título, corpo, data de publicação, metadados de origem e enriquecimento NLP abrangente.
Os campos de enriquecimento incluem pontuações de sentimento (positivo/negativo/neutro), entidades extraídas (pessoas, organizações, locais, marcas), classificação de tópicos e categorias, tags de indústria e métricas de legibilidade. O agrupamento de histórias agrupa artigos relacionados automaticamente.
Para engenheiros de dados e analistas, a saída estruturada elimina a complexidade de análise. Esquemas JSON consistentes funcionam diretamente com bancos de dados, plataformas de análise e pipelines de ML. Exportação para CSV, XLSX ou XML para integração de planilhas e ferramentas de BI.