Gestructureerde Nieuwsdata

Onze structured news data API biedt een eenvoudige manier om toegang te krijgen tot nieuwsartikelen van over de hele wereld. We bieden een eenvoudige, consistente en gebruiksvriendelijke API om toegang te krijgen tot nieuwsartikelen uit duizenden bronnen.

title

De titel van het nieuwsartikel.

href

De URL van het nieuwsartikel.

description

Een beschrijving van het nieuwsartikel.

body

De volledige inhoud van het nieuwsartikel.

published_at

De datum waarop het nieuwsartikel werd gepubliceerd.

image

De afbeelding van het nieuwsartikel.

taal

De taal van het nieuwsartikel.

Categorie

De categorie van het nieuwsartikel.

topic

Het onderwerp van het nieuwsartikel.

industry

De industrie van het nieuwsartikel.

sentiment

Het sentiment van het nieuwsartikel.

🔥 story

Groepeer de artikelen in verhalen.

Bron

Artikel Bron informatie.

🔥 is_breaking

Breaking news detectie.

is_duplicate

Duplicatendetectie.

is_paywall

Paywall detectie.

links

De links uit het nieuwsartikel.

media

De media uit het nieuwsartikel.

hashtags

De hashtags uit het nieuwsartikel.

read_time

De geschatte tijd om het artikel in minuten te lezen.

sentences_count

Het aantal zinnen in het artikel.

alinea's_aantal

Het aantal paragrafen in het artikel.

words_count

Het aantal woorden in het artikel.

characters_count

Het aantal karakters in het artikel.

Veelgestelde vragen

Elk artikel bevat kernvelden (titel, beschrijving, tekst, URL, publicatiedatum, afbeelding) plus verrijkte gegevens: sentimentanalyse, categorie, onderwerp, brancheclassificatie, taal, broninformatie met uitgeversbeoordeling, story clustering-ID en inhoudsmetrieken zoals woordenaantal en leestijd. We extraheren ook entiteiten, hashtags, links en media uit de artikelinhoud.
Onze sentimentanalyse gebruikt NLP-modellen getraind op nieuwsinhoud om artikelen te classificeren als positief, negatief of neutraal. Elk artikel krijgt een polariteitsscore en betrouwbaarheidsniveau. Het model analyseert de volledige artikeltekst, niet alleen koppen, en bereikt hoge nauwkeurigheid in meer dan 50 talen. U kunt zoekresultaten filteren op sentiment om specifieke emotionele tonen te vinden.
Verhaalclustering groepeert gerelateerde artikelen die hetzelfde evenement of onderwerp behandelen. Wanneer meerdere uitgevers verslag doen van hetzelfde nieuws, wijzen we hen dezelfde story-ID toe. Dit helpt u bij het volgen van hoe verhalen zich in de loop van de tijd ontwikkelen, trending onderwerpen te identificeren, de breedte van de dekking te meten en het verwerken van dubbele inhoud van verschillende bronnen te voorkomen.
Ons duplicaatdetectie-algoritme analyseert artikelinhoud, entiteiten en publicatietiming om te identificeren wanneer meerdere uitgevers hetzelfde verhaal behandelen. Elk artikel heeft een is_duplicate-vlag. Dit helpt u redundante content te filteren en te focussen op uniek nieuws. In combinatie met verhaalclustering kunt u één artikel per verhaal krijgen of volledige dekking volgen.
APITube ondersteunt meerdere exportformaten: JSON (standaard), CSV, TSV, XLSX (Excel), XML en RSS-feeds. Alle formaten bevatten dezelfde gegevensvelden. Kies het formaat dat het beste past bij uw werkstroom - JSON voor API's, CSV/XLSX voor spreadsheets en BI-tools, RSS voor feed-readers, XML voor verouderde systemen.
Uitgeversbeoordeling (OPR - Overall Publisher Rank) wordt gescoord van 0-10 op basis van meerdere factoren: domeingezag, verkeersvolume, contentcwaliteit, publicatiefrequentie en redactionele standaarden. Hoger gerangschikte bronnen (6 ) omvatten doorgaans grote nieuwsmedia zoals Reuters, BBC, NYT. Gebruik deze filter om gezaghebbende bronnen te prioriteren of laagwaardige content uit te sluiten.
Onze NER (Named Entity Recognition) extraheert personen, organisaties, locaties, merken, evenementen en meer uit artikeltekst. Elke entiteit bevat haar type en aantal vermeldingen. Gebruik entiteitsgegevens voor merkbewaking, tracking van specifieke bedrijven, analyse van geografische dekking of het bouwen van kennisgrafieken uit nieuwsinhoud.
De API retourneert beide velden: beschrijving (samenvatting/uittreksel) en tekst (volledige artikeltekst). Het tekstveld bevat de volledige schone artikelinhoud met HTML verwijderd. Sommige artikelen achter betaalmuren kunnen beperkte tekst hebben - controleer de is_paywall-vlag. Volledige tekst is inbegrepen in alle abonnementen, zonder extra kosten.

Gestructureerde Nieuws Data API: Voorbij Ruwe Artikelen

APITube levert gestructureerde nieuwsgegevens met consistente schema's uit meer dan 500.000 bronnen. Elk artikel bevat genormaliseerde velden: titel, tekst, publicatiedatum, bron-metadata en uitgebreide NLP-verrijking.

Verrijkingsvelden omvatten sentimentscores (positief/negatief/neutraal), geëxtraheerde entiteiten (personen, organisaties, locaties, merken), thema- en categoryclassificatie, branchetags en leesbaarheidsmetrieken. Verhaalclustering groepeert gerelateerde artikelen automatisch.

Voor data-ingenieurs en analisten elimineert gestructureerde output parsings-complexiteit. Consistente JSON-schema's werken rechtstreeks met databases, analysplatforms en ML-pijplijnen. Exporteren naar CSV, XLSX of XML voor spreadsheet- en BI-tool-integratie.