Strukturerad Nyhetsdata
Vårt strukturerade API för nyhetsdata ger ett enkelt sätt att få tillgång till nyhetsartiklar från hela världen. Vi tillhandahåller ett enkelt, konsekvent och lättanvänt API för att få tillgång till nyhetsartiklar från tusentals källor.
title
Titeln på nyhetsartikeln.
href
Webbadressen till nyhetsartikeln.
description
En beskrivning av nyhetsartikeln.
body
Hela innehållet i nyhetsartikeln.
published_at
Datumet då nyhetsartikeln publicerades.
image
Bilden av nyhetsartikeln.
språk
Språket i nyhetsartikeln.
Kategori
Kategorin för nyhetsartikeln.
topic
Ämnet för nyhetsartikeln.
industry
Branschen i nyhetsartikeln.
sentiment
Känslan i nyhetsartikeln.
🔥 story
Gruppera artiklarna i berättelser.
Källa
Artikel Källa information.
🔥 är_breaking
Breaking news upptäckt.
is_duplicate
Duplicera detektering.
is_paywall
Paywall upptäckt.
links
Länkarna från nyhetsartikeln.
media
Media från nyhetsartikeln.
hashtags
Hashtags från nyhetsartikeln.
read_time
Den beräknade tiden att läsa artikeln i minuter.
sentences_count
Antalet meningar i artikeln.
paragraphs_count
Antalet stycken i artikeln.
words_count
Antalet ord i artikeln.
characters_count
Antalet tecken i artikeln.
Vanliga frågor
- Varje artikel innehåller kärnfält (titel, beskrivning, brödtext, URL, publikationsdatum, bild) plus förrikad data: sentimentanalys, kategori, ämne, branschklassificering, språk, källinformation med utgivarranking, story clustering-ID och innehållsmått som ordantal och lästid. Vi extraherar också entiteter, hashtags, länkar och media från artikelinnehållet.
- Vår sentimentanalys använder NLP-modeller tränade på nyhetsinnehåll för att klassificera artiklar som positiva, negativa eller neutrala. Varje artikel får en polaritetspoäng och konfidensnivå. Modellen analyserar hela artikeltexten, inte bara rubriker, och uppnår hög noggrannhet på över 50 språk. Du kan filtrera sökresultat efter sentiment för att hitta specifika emotionella toner.
- Storyclusteringen grupperar relaterade artiklar som täcker samma händelse eller ämne. När flera utgivare rapporterar samma nyheter, tilldelar vi dem samma story-ID. Detta hjälper dig att spåra hur historier utvecklas över tid, identifiera trendande ämnen, mäta täckningsbredd och undvika att bearbeta duplicerat innehåll från olika källor.
- Vår dubblettdetekteringsalgoritm analyserar artikelinnehåll, enheter och publiceringStidpunkt för att identifiera när flera utgivare täcker samma historia. Varje artikel har en is_duplicate-flagga. Detta hjälper dig att filtrera bort redundant innehåll och fokusera på unika nyheter. Kombinerat med storyclusterering kan du få en artikel per historia eller spåra full täckning.
- APITube stöder flera exportformat: JSON (standard), CSV, TSV, XLSX (Excel), XML och RSS-flöden. Alla format inkluderar samma datafält. Välj det format som bäst passar din arbetsflöde - JSON för API:er, CSV/XLSX för kalkylblad och BI-verktyg, RSS för flödesläsare, XML för äldre system.
- Utgivarranking (OPR - Overall Publisher Rank) poängsätts från 0-10 baserat på flera faktorer: domänauktoritet, trafikvolym, innehållskvalitet, publikationsfrekvens och redaktionella standarder. Högre rankade källor (6 ) inkluderar typiskt stora nyhetsmedier som Reuters, BBC, NYT. Använd detta filter för att prioritera auktoritativa källor eller utesluta innehåll av låg kvalitet.
- Vår NER (Namngiven Enhetsigenkänning) extraherar personer, organisationer, platser, varumärken, händelser och mer från artikeltext. Varje enhet inkluderar sin typ och antal omnämnanden. Använd enhetsdata för varumärkesövervakning, spårning av specifika företag, analys av geografisk täckning eller bygga kunskapsgraf från nyhetsinnehåll.
- API:n returnerar båda fälten: beskrivning (sammanfattning/utdrag) och brödtext (full artikeltext). Brödtextfältet innehåller det fullständigt rengjorda artikelinnehållet med HTML borttaget. Vissa artiklar bakom betalväggar kan ha begränsat brödtextinnehåll - kontrollera is_paywall-flaggan. Fullständig brödtextåtkomst ingår i alla abonnemang, utan extra kostnad.
Strukturerad Nyhetsdata-API: Bortom Råa Artiklar
APITube levererar strukturerad nyhetsdata med konsekventa scheman över mer än 500 000 källor. Varje artikel inkluderar normaliserade fält: titel, brödtext, publikationsdatum, källmetadata och omfattande NLP-berikning.
Berikningsfält inkluderar sentimentpoäng (positiv/negativ/neutral), extraherade enheter (personer, organisationer, platser, varumärken), ämnes- och kategoriklassificering, branschtaggar och läsbarhetsmetoder. Storyclustering grupperar relaterade artiklar automatiskt.
För datatekniker och analytiker eliminerar strukturerad utdata parsing-komplexitet. Konsekventa JSON-scheman arbetar direkt med databaser, analysplattformar och ML-pipelines. Exportera till CSV, XLSX eller XML för kalkylblads- och BI-verktygsintegration.