Dados De Notícias Estruturados

Nossa API structured news data fornece uma maneira simples de acessar artigos de notícias de todo o mundo. Nós fornecemos uma API simples, consistente e fácil de usar para acessar artigos de notícias de milhares de fontes.

title

O título do artigo de notícias.

href

O URL do artigo de notícias.

description

Uma descrição do artigo de notícias.

body

O conteúdo completo do artigo de notícias.

published_at

Data em que o artigo foi publicado.

image

A imagem do artigo de notícias.

língua

A língua do artigo noticioso.

Categoria

A categoria do artigo de notícias.

topic

O tema do artigo de notícias.

industry

A indústria do artigo de notícias.

sentimento

O sentimento do artigo de notícias.

🔥 story

Agrupe os artigos em histórias.

Fonte

Informações da fonte do artigo.

🔥 esta_quebrando

Detecção de notícias de última hora.

is_duplicate

Detecção de duplicados.

is_paywall

Detecção de Paywall.

links

Os links do artigo de notícias.

media

A mídia do artigo de notícias.

hashtags

As hashtags do artigo de notícias.

read_time

O tempo estimado para ler o artigo em minutos.

sentences_count

O número de frases no artigo.

contagem_de_parágrafos

O número de parágrafos do artigo.

words_count

O número de palavras no artigo.

characters_count

O número de caracteres no artigo.

Perguntas frequentes

Cada artigo inclui campos principais (título, descrição, corpo, URL, data de publicação, imagem) além de dados enriquecidos: análise de sentimento, categoria, tópico, classificação de indústria, idioma, informações de origem com ranking do publicador, ID de agrupamento de histórias e métricas de conteúdo como contagem de palavras e tempo de leitura. Também extraímos entidades, hashtags, links e mídia do conteúdo do artigo.
Nossa análise de sentimento usa modelos de NLP treinados em conteúdo de notícias para classificar artigos como positivos, negativos ou neutros. Cada artigo recebe uma pontuação de polaridade e um nível de confiança. O modelo analisa o texto completo do artigo, não apenas manchetes, alcançando alta precisão em mais de 50 idiomas. Você pode filtrar resultados de pesquisa por sentimento para encontrar tons emocionais específicos.
O agrupamento de histórias agrupa artigos relacionados que cobrem o mesmo evento ou tópico. Quando múltiplos editores relatam a mesma notícia, atribuímos a eles o mesmo ID de história. Isso ajuda você a acompanhar como as histórias se desenvolvem ao longo do tempo, identificar tópicos em tendência, medir a amplitude da cobertura e evitar processar conteúdo duplicado de diferentes fontes.
Nosso algoritmo de detecção de duplicatas analisa o conteúdo do artigo, entidades e tempo de publicação para identificar quando múltiplos editores cobrem a mesma história. Cada artigo tem uma flag is_duplicate. Isso ajuda a filtrar conteúdo redundante e focar em notícias únicas. Combinado com o agrupamento de histórias, você pode obter um artigo por história ou rastrear a cobertura completa.
APITube suporta múltiplos formatos de exportação: JSON (padrão), CSV, TSV, XLSX (Excel), XML e feeds RSS. Todos os formatos incluem os mesmos campos de dados. Escolha o formato que melhor se adapta ao seu fluxo de trabalho - JSON para APIs, CSV/XLSX para planilhas e ferramentas de BI, RSS para leitores de feed, XML para sistemas legados.
Classificação do publicador (OPR - Overall Publisher Rank) é pontuada de 0-10 com base em múltiplos fatores: autoridade de domínio, volume de tráfego, qualidade de conteúdo, frequência de publicação e padrões editoriais. Fontes de classificação mais alta (6 ) geralmente incluem grandes veículos de notícias como Reuters, BBC, NYT. Use este filtro para priorizar fontes autorizadas ou excluir conteúdo de baixa qualidade.
Nosso NER (Reconhecimento de Entidades Nomeadas) extrai pessoas, organizações, locais, marcas, eventos e mais do texto do artigo. Cada entidade inclui seu tipo e contagem de menções. Use dados de entidades para monitoramento de marca, rastreamento de empresas específicas, análise de cobertura geográfica ou construção de grafos de conhecimento a partir de conteúdo de notícias.
A API retorna ambos os campos: descrição (resumo/excerto) e corpo (texto completo do artigo). O campo de corpo contém o conteúdo do artigo completamente limpo com HTML removido. Alguns artigos por trás de paywall podem ter conteúdo de corpo limitado - verifique a flag is_paywall. Acesso ao corpo completo está incluído em todos os planos, sem custo adicional.

API de Dados de Notícias Estruturados: Além dos Artigos Brutos

APITube fornece dados de notícias estruturados com esquemas consistentes em mais de 500.000 fontes. Cada artigo inclui campos normalizados: título, corpo, data de publicação, metadados de origem e enriquecimento NLP abrangente.

Os campos de enriquecimento incluem pontuações de sentimento (positivo/negativo/neutro), entidades extraídas (pessoas, organizações, locais, marcas), classificação de tópicos e categorias, tags de indústria e métricas de legibilidade. O agrupamento de histórias agrupa artigos relacionados automaticamente.

Para engenheiros de dados e analistas, a saída estruturada elimina a complexidade de análise. Esquemas JSON consistentes funcionam diretamente com bancos de dados, plataformas de análise e pipelines de ML. Exportação para CSV, XLSX ou XML para integração de planilhas e ferramentas de BI.