Strukturierte Nachrichtendaten

Unsere strukturierte Nachrichtendaten-API bietet eine einfache Möglichkeit, auf Nachrichtenartikel aus der ganzen Welt zuzugreifen. Wir bieten eine einfache, konsistente und benutzerfreundliche API für den Zugriff auf Nachrichtenartikel aus Tausenden von Quellen.

title

Der Titel des Nachrichtenartikels.

href

Die URL des Nachrichtenartikels.

description

Eine Beschreibung des Nachrichtenartikels.

body

Der vollständige Inhalt des Nachrichtenartikels.

published_at

Das Datum, an dem der Nachrichtenartikel veröffentlicht wurde.

image

Das Bild des Nachrichtenartikels.

sprachlich

Die Sprache des Nachrichtenartikels.

Kategorie

Die Kategorie des Nachrichtenartikels.

topic

Das Thema des Nachrichtenartikels.

industry

Die Branche des Nachrichtenartikels.

Stimmung

Die Stimmung des Nachrichtenartikels.

🔥 story

Gruppieren Sie die Artikel in Geschichten.

Quelle

Informationen zur Artikelquelle.

🔥 ist_breaking

Erkennung aktueller Nachrichten.

is_duplicate

Duplikaterkennung.

is_paywall

Paywall-Erkennung.

links

Die Links aus dem Nachrichtenartikel.

media

Die Medien aus dem Nachrichtenartikel.

hashtags

Die Hashtags aus dem Nachrichtenartikel.

read_time

Die geschätzte Zeit zum Lesen des Artikels in Minuten.

sentences_count

Die Anzahl der Sätze im Artikel.

Absätze_Anzahl

Die Anzahl der Absätze im Artikel.

words_count

Die Anzahl der Wörter im Artikel.

characters_count

Die Anzahl der Zeichen im Artikel.

Häufig gestellte Fragen

Jeder Artikel enthält Kernfelder (Titel, Beschreibung, Text, URL, Veröffentlichungsdatum, Bild) sowie angereicherte Daten: Sentimentanalyse, Kategorie, Thema, Branchenklassifizierung, Sprache, Quelleninformationen mit Publisher-Rang, Story-Clustering-ID und Inhaltsmetriken wie Wortanzahl und Lesezeit. Wir extrahieren auch Entitäten, Hashtags, Links und Medien aus dem Artikelinhalt.
Unsere Sentimentanalyse verwendet auf Nachrichteninhalten trainierte NLP-Modelle, um Artikel als positiv, negativ oder neutral zu klassifizieren. Jeder Artikel erhält eine Polaritätsbewertung und ein Konfidenzlevel. Das Modell analysiert den vollständigen Artikeltext, nicht nur Überschriften, und erreicht hohe Genauigkeit in über 50 Sprachen. Sie können Suchergebnisse nach Sentiment filtern, um bestimmte emotionale Töne zu finden.
Storyclusterung gruppiert verwandte Artikel, die dasselbe Ereignis oder Thema behandeln. Wenn mehrere Herausgeber über dieselbe Nachricht berichten, weisen wir ihnen dieselbe Story-ID zu. Dies hilft Ihnen, die Entwicklung von Geschichten im Laufe der Zeit zu verfolgen, Trending-Themen zu identifizieren, die Berichterstattungsbreite zu messen und zu vermeiden, doppelte Inhalte von verschiedenen Quellen zu verarbeiten.
Unser Duplikat-Erkennungsalgorithmus analysiert Artikelinhalt, Entitäten und Publikationszeitpunkt, um zu identifizieren, wann mehrere Herausgeber dieselbe Geschichte behandeln. Jeder Artikel hat eine is_duplicate-Kennzeichnung. Dies hilft Ihnen, redundante Inhalte herauszufiltern und sich auf einzigartige Nachrichten zu konzentrieren. In Kombination mit Storyclusterung können Sie einen Artikel pro Geschichte erhalten oder die vollständige Berichterstattung verfolgen.
APITube unterstützt mehrere Exportformate: JSON (Standard), CSV, TSV, XLSX (Excel), XML und RSS-Feeds. Alle Formate enthalten die gleichen Datenfelder. Wählen Sie das Format, das am besten zu Ihrem Arbeitsablauf passt - JSON für APIs, CSV/XLSX für Tabellenkalkulationen und BI-Tools, RSS für Feed-Reader, XML für Altsysteme.
Publisher-Rang (OPR - Overall Publisher Rank) wird von 0-10 basierend auf verschiedenen Faktoren bewertet: Domänenautorität, Verkehrsvolumen, Inhaltsqualität, Veröffentlichungshäufigkeit und redaktionelle Standards. Höher eingestufte Quellen (6 ) umfassen typischerweise große Nachrichtenmedien wie Reuters, BBC, NYT. Verwenden Sie diesen Filter, um maßgebliche Quellen zu priorisieren oder minderwertige Inhalte auszuschließen.
Unsere NER (Named Entity Recognition) extrahiert Personen, Organisationen, Orte, Marken, Ereignisse und mehr aus dem Artikeltext. Jede Entität enthält ihren Typ und die Anzahl der Erwähnungen. Nutzen Sie Entitätsdaten für Markenmonitoring, Verfolgung spezifischer Unternehmen, Analyse geografischer Abdeckung oder Aufbau von Wissensdiagrammen aus Nachrichteninhalten.
Die API gibt beide Felder zurück: Beschreibung (Zusammenfassung/Auszug) und Text (vollständiger Artikeltext). Das Textfeld enthält den vollständig bereinigten Artikelinhalt ohne HTML. Einige Artikel hinter Bezahlschranken können eingeschränkten Textinhalt haben - überprüfen Sie die Paywall-Markierung. Vollständiger Textzugang ist in allen Tarifen enthalten, ohne Zusatzkosten.

Strukturierte Nachrichten-Daten-API: Über rohe Artikel hinaus

APITube liefert strukturierte Nachrichtendaten mit konsistenten Schemas aus über 500.000 Quellen. Jeder Artikel enthält normmialisierte Felder: Titel, Text, Veationrö,metadatenadatenende NLP-Anreicherung.

Anreicherungsfelder umfassen Sentimentwerte (positiv/negativ/neutral), extrahierte Entitäten (Personen, Organisationen, Orte, Marken), Themen- und Kategorienklassifizierung, Branchentags und Lesbarkeitsmetriken. Storyclusterung gruppiert verwandte Artikel automatisch.

Für Dateningenieure und Analysten beseitigt strukturierte Ausgabe Parsing-Komplexität. Konsistente JSON-Schemas arbeiten direkt mit Datenbanken, Analyseplattformen und ML-Pipelines. Export zu CSV, XLSX oder XML für Tabellenkalkulationsprogramme und BI-Tool-Integration.