Gestructureerde Nieuwsdata
Onze structured news data API biedt een eenvoudige manier om toegang te krijgen tot nieuwsartikelen van over de hele wereld. We bieden een eenvoudige, consistente en gebruiksvriendelijke API om toegang te krijgen tot nieuwsartikelen uit duizenden bronnen.
title
De titel van het nieuwsartikel.
href
De URL van het nieuwsartikel.
description
Een beschrijving van het nieuwsartikel.
body
De volledige inhoud van het nieuwsartikel.
published_at
De datum waarop het nieuwsartikel werd gepubliceerd.
image
De afbeelding van het nieuwsartikel.
taal
De taal van het nieuwsartikel.
Categorie
De categorie van het nieuwsartikel.
topic
Het onderwerp van het nieuwsartikel.
industry
De industrie van het nieuwsartikel.
sentiment
Het sentiment van het nieuwsartikel.
🔥 story
Groepeer de artikelen in verhalen.
Bron
Artikel Bron informatie.
🔥 is_breaking
Breaking news detectie.
is_duplicate
Duplicatendetectie.
is_paywall
Paywall detectie.
links
De links uit het nieuwsartikel.
media
De media uit het nieuwsartikel.
hashtags
De hashtags uit het nieuwsartikel.
read_time
De geschatte tijd om het artikel in minuten te lezen.
sentences_count
Het aantal zinnen in het artikel.
alinea's_aantal
Het aantal paragrafen in het artikel.
words_count
Het aantal woorden in het artikel.
characters_count
Het aantal karakters in het artikel.
Veelgestelde vragen
- Elk artikel bevat kernvelden (titel, beschrijving, tekst, URL, publicatiedatum, afbeelding) plus verrijkte gegevens: sentimentanalyse, categorie, onderwerp, brancheclassificatie, taal, broninformatie met uitgeversbeoordeling, story clustering-ID en inhoudsmetrieken zoals woordenaantal en leestijd. We extraheren ook entiteiten, hashtags, links en media uit de artikelinhoud.
- Onze sentimentanalyse gebruikt NLP-modellen getraind op nieuwsinhoud om artikelen te classificeren als positief, negatief of neutraal. Elk artikel krijgt een polariteitsscore en betrouwbaarheidsniveau. Het model analyseert de volledige artikeltekst, niet alleen koppen, en bereikt hoge nauwkeurigheid in meer dan 50 talen. U kunt zoekresultaten filteren op sentiment om specifieke emotionele tonen te vinden.
- Verhaalclustering groepeert gerelateerde artikelen die hetzelfde evenement of onderwerp behandelen. Wanneer meerdere uitgevers verslag doen van hetzelfde nieuws, wijzen we hen dezelfde story-ID toe. Dit helpt u bij het volgen van hoe verhalen zich in de loop van de tijd ontwikkelen, trending onderwerpen te identificeren, de breedte van de dekking te meten en het verwerken van dubbele inhoud van verschillende bronnen te voorkomen.
- Ons duplicaatdetectie-algoritme analyseert artikelinhoud, entiteiten en publicatietiming om te identificeren wanneer meerdere uitgevers hetzelfde verhaal behandelen. Elk artikel heeft een is_duplicate-vlag. Dit helpt u redundante content te filteren en te focussen op uniek nieuws. In combinatie met verhaalclustering kunt u één artikel per verhaal krijgen of volledige dekking volgen.
- APITube ondersteunt meerdere exportformaten: JSON (standaard), CSV, TSV, XLSX (Excel), XML en RSS-feeds. Alle formaten bevatten dezelfde gegevensvelden. Kies het formaat dat het beste past bij uw werkstroom - JSON voor API's, CSV/XLSX voor spreadsheets en BI-tools, RSS voor feed-readers, XML voor verouderde systemen.
- Uitgeversbeoordeling (OPR - Overall Publisher Rank) wordt gescoord van 0-10 op basis van meerdere factoren: domeingezag, verkeersvolume, contentcwaliteit, publicatiefrequentie en redactionele standaarden. Hoger gerangschikte bronnen (6 ) omvatten doorgaans grote nieuwsmedia zoals Reuters, BBC, NYT. Gebruik deze filter om gezaghebbende bronnen te prioriteren of laagwaardige content uit te sluiten.
- Onze NER (Named Entity Recognition) extraheert personen, organisaties, locaties, merken, evenementen en meer uit artikeltekst. Elke entiteit bevat haar type en aantal vermeldingen. Gebruik entiteitsgegevens voor merkbewaking, tracking van specifieke bedrijven, analyse van geografische dekking of het bouwen van kennisgrafieken uit nieuwsinhoud.
- De API retourneert beide velden: beschrijving (samenvatting/uittreksel) en tekst (volledige artikeltekst). Het tekstveld bevat de volledige schone artikelinhoud met HTML verwijderd. Sommige artikelen achter betaalmuren kunnen beperkte tekst hebben - controleer de is_paywall-vlag. Volledige tekst is inbegrepen in alle abonnementen, zonder extra kosten.
Gestructureerde Nieuws Data API: Voorbij Ruwe Artikelen
APITube levert gestructureerde nieuwsgegevens met consistente schema's uit meer dan 500.000 bronnen. Elk artikel bevat genormaliseerde velden: titel, tekst, publicatiedatum, bron-metadata en uitgebreide NLP-verrijking.
Verrijkingsvelden omvatten sentimentscores (positief/negatief/neutraal), geëxtraheerde entiteiten (personen, organisaties, locaties, merken), thema- en categoryclassificatie, branchetags en leesbaarheidsmetrieken. Verhaalclustering groepeert gerelateerde artikelen automatisch.
Voor data-ingenieurs en analisten elimineert gestructureerde output parsings-complexiteit. Consistente JSON-schema's werken rechtstreeks met databases, analysplatforms en ML-pijplijnen. Exporteren naar CSV, XLSX of XML voor spreadsheet- en BI-tool-integratie.