Strukturerad Nyhetsdata

Vårt strukturerade API för nyhetsdata ger ett enkelt sätt att få tillgång till nyhetsartiklar från hela världen. Vi tillhandahåller ett enkelt, konsekvent och lättanvänt API för att få tillgång till nyhetsartiklar från tusentals källor.

title

Titeln på nyhetsartikeln.

href

Webbadressen till nyhetsartikeln.

description

En beskrivning av nyhetsartikeln.

body

Hela innehållet i nyhetsartikeln.

published_at

Datumet då nyhetsartikeln publicerades.

image

Bilden av nyhetsartikeln.

språk

Språket i nyhetsartikeln.

Kategori

Kategorin för nyhetsartikeln.

topic

Ämnet för nyhetsartikeln.

industry

Branschen i nyhetsartikeln.

sentiment

Känslan i nyhetsartikeln.

🔥 story

Gruppera artiklarna i berättelser.

Källa

Artikel Källa information.

🔥 är_breaking

Breaking news upptäckt.

is_duplicate

Duplicera detektering.

is_paywall

Paywall upptäckt.

links

Länkarna från nyhetsartikeln.

media

Media från nyhetsartikeln.

hashtags

Hashtags från nyhetsartikeln.

read_time

Den beräknade tiden att läsa artikeln i minuter.

sentences_count

Antalet meningar i artikeln.

paragraphs_count

Antalet stycken i artikeln.

words_count

Antalet ord i artikeln.

characters_count

Antalet tecken i artikeln.

Vanliga frågor

Varje artikel innehåller kärnfält (titel, beskrivning, brödtext, URL, publikationsdatum, bild) plus förrikad data: sentimentanalys, kategori, ämne, branschklassificering, språk, källinformation med utgivarranking, story clustering-ID och innehållsmått som ordantal och lästid. Vi extraherar också entiteter, hashtags, länkar och media från artikelinnehållet.
Vår sentimentanalys använder NLP-modeller tränade på nyhetsinnehåll för att klassificera artiklar som positiva, negativa eller neutrala. Varje artikel får en polaritetspoäng och konfidensnivå. Modellen analyserar hela artikeltexten, inte bara rubriker, och uppnår hög noggrannhet på över 50 språk. Du kan filtrera sökresultat efter sentiment för att hitta specifika emotionella toner.
Storyclusteringen grupperar relaterade artiklar som täcker samma händelse eller ämne. När flera utgivare rapporterar samma nyheter, tilldelar vi dem samma story-ID. Detta hjälper dig att spåra hur historier utvecklas över tid, identifiera trendande ämnen, mäta täckningsbredd och undvika att bearbeta duplicerat innehåll från olika källor.
Vår dubblettdetekteringsalgoritm analyserar artikelinnehåll, enheter och publiceringStidpunkt för att identifiera när flera utgivare täcker samma historia. Varje artikel har en is_duplicate-flagga. Detta hjälper dig att filtrera bort redundant innehåll och fokusera på unika nyheter. Kombinerat med storyclusterering kan du få en artikel per historia eller spåra full täckning.
APITube stöder flera exportformat: JSON (standard), CSV, TSV, XLSX (Excel), XML och RSS-flöden. Alla format inkluderar samma datafält. Välj det format som bäst passar din arbetsflöde - JSON för API:er, CSV/XLSX för kalkylblad och BI-verktyg, RSS för flödesläsare, XML för äldre system.
Utgivarranking (OPR - Overall Publisher Rank) poängsätts från 0-10 baserat på flera faktorer: domänauktoritet, trafikvolym, innehållskvalitet, publikationsfrekvens och redaktionella standarder. Högre rankade källor (6 ) inkluderar typiskt stora nyhetsmedier som Reuters, BBC, NYT. Använd detta filter för att prioritera auktoritativa källor eller utesluta innehåll av låg kvalitet.
Vår NER (Namngiven Enhetsigenkänning) extraherar personer, organisationer, platser, varumärken, händelser och mer från artikeltext. Varje enhet inkluderar sin typ och antal omnämnanden. Använd enhetsdata för varumärkesövervakning, spårning av specifika företag, analys av geografisk täckning eller bygga kunskapsgraf från nyhetsinnehåll.
API:n returnerar båda fälten: beskrivning (sammanfattning/utdrag) och brödtext (full artikeltext). Brödtextfältet innehåller det fullständigt rengjorda artikelinnehållet med HTML borttaget. Vissa artiklar bakom betalväggar kan ha begränsat brödtextinnehåll - kontrollera is_paywall-flaggan. Fullständig brödtextåtkomst ingår i alla abonnemang, utan extra kostnad.

Strukturerad Nyhetsdata-API: Bortom Råa Artiklar

APITube levererar strukturerad nyhetsdata med konsekventa scheman över mer än 500 000 källor. Varje artikel inkluderar normaliserade fält: titel, brödtext, publikationsdatum, källmetadata och omfattande NLP-berikning.

Berikningsfält inkluderar sentimentpoäng (positiv/negativ/neutral), extraherade enheter (personer, organisationer, platser, varumärken), ämnes- och kategoriklassificering, branschtaggar och läsbarhetsmetoder. Storyclustering grupperar relaterade artiklar automatiskt.

För datatekniker och analytiker eliminerar strukturerad utdata parsing-komplexitet. Konsekventa JSON-scheman arbetar direkt med databaser, analysplattformar och ML-pipelines. Exportera till CSV, XLSX eller XML för kalkylblads- och BI-verktygsintegration.