Strukturierte Nachrichtendaten
Unsere strukturierte Nachrichtendaten-API bietet eine einfache Möglichkeit, auf Nachrichtenartikel aus der ganzen Welt zuzugreifen. Wir bieten eine einfache, konsistente und benutzerfreundliche API für den Zugriff auf Nachrichtenartikel aus Tausenden von Quellen.
title
Der Titel des Nachrichtenartikels.
href
Die URL des Nachrichtenartikels.
description
Eine Beschreibung des Nachrichtenartikels.
body
Der vollständige Inhalt des Nachrichtenartikels.
published_at
Das Datum, an dem der Nachrichtenartikel veröffentlicht wurde.
image
Das Bild des Nachrichtenartikels.
sprachlich
Die Sprache des Nachrichtenartikels.
Kategorie
Die Kategorie des Nachrichtenartikels.
topic
Das Thema des Nachrichtenartikels.
industry
Die Branche des Nachrichtenartikels.
Stimmung
Die Stimmung des Nachrichtenartikels.
🔥 story
Gruppieren Sie die Artikel in Geschichten.
Quelle
Informationen zur Artikelquelle.
🔥 ist_breaking
Erkennung aktueller Nachrichten.
is_duplicate
Duplikaterkennung.
is_paywall
Paywall-Erkennung.
links
Die Links aus dem Nachrichtenartikel.
media
Die Medien aus dem Nachrichtenartikel.
hashtags
Die Hashtags aus dem Nachrichtenartikel.
read_time
Die geschätzte Zeit zum Lesen des Artikels in Minuten.
sentences_count
Die Anzahl der Sätze im Artikel.
Absätze_Anzahl
Die Anzahl der Absätze im Artikel.
words_count
Die Anzahl der Wörter im Artikel.
characters_count
Die Anzahl der Zeichen im Artikel.
Häufig gestellte Fragen
- Jeder Artikel enthält Kernfelder (Titel, Beschreibung, Text, URL, Veröffentlichungsdatum, Bild) sowie angereicherte Daten: Sentimentanalyse, Kategorie, Thema, Branchenklassifizierung, Sprache, Quelleninformationen mit Publisher-Rang, Story-Clustering-ID und Inhaltsmetriken wie Wortanzahl und Lesezeit. Wir extrahieren auch Entitäten, Hashtags, Links und Medien aus dem Artikelinhalt.
- Unsere Sentimentanalyse verwendet auf Nachrichteninhalten trainierte NLP-Modelle, um Artikel als positiv, negativ oder neutral zu klassifizieren. Jeder Artikel erhält eine Polaritätsbewertung und ein Konfidenzlevel. Das Modell analysiert den vollständigen Artikeltext, nicht nur Überschriften, und erreicht hohe Genauigkeit in über 50 Sprachen. Sie können Suchergebnisse nach Sentiment filtern, um bestimmte emotionale Töne zu finden.
- Storyclusterung gruppiert verwandte Artikel, die dasselbe Ereignis oder Thema behandeln. Wenn mehrere Herausgeber über dieselbe Nachricht berichten, weisen wir ihnen dieselbe Story-ID zu. Dies hilft Ihnen, die Entwicklung von Geschichten im Laufe der Zeit zu verfolgen, Trending-Themen zu identifizieren, die Berichterstattungsbreite zu messen und zu vermeiden, doppelte Inhalte von verschiedenen Quellen zu verarbeiten.
- Unser Duplikat-Erkennungsalgorithmus analysiert Artikelinhalt, Entitäten und Publikationszeitpunkt, um zu identifizieren, wann mehrere Herausgeber dieselbe Geschichte behandeln. Jeder Artikel hat eine is_duplicate-Kennzeichnung. Dies hilft Ihnen, redundante Inhalte herauszufiltern und sich auf einzigartige Nachrichten zu konzentrieren. In Kombination mit Storyclusterung können Sie einen Artikel pro Geschichte erhalten oder die vollständige Berichterstattung verfolgen.
- APITube unterstützt mehrere Exportformate: JSON (Standard), CSV, TSV, XLSX (Excel), XML und RSS-Feeds. Alle Formate enthalten die gleichen Datenfelder. Wählen Sie das Format, das am besten zu Ihrem Arbeitsablauf passt - JSON für APIs, CSV/XLSX für Tabellenkalkulationen und BI-Tools, RSS für Feed-Reader, XML für Altsysteme.
- Publisher-Rang (OPR - Overall Publisher Rank) wird von 0-10 basierend auf verschiedenen Faktoren bewertet: Domänenautorität, Verkehrsvolumen, Inhaltsqualität, Veröffentlichungshäufigkeit und redaktionelle Standards. Höher eingestufte Quellen (6 ) umfassen typischerweise große Nachrichtenmedien wie Reuters, BBC, NYT. Verwenden Sie diesen Filter, um maßgebliche Quellen zu priorisieren oder minderwertige Inhalte auszuschließen.
- Unsere NER (Named Entity Recognition) extrahiert Personen, Organisationen, Orte, Marken, Ereignisse und mehr aus dem Artikeltext. Jede Entität enthält ihren Typ und die Anzahl der Erwähnungen. Nutzen Sie Entitätsdaten für Markenmonitoring, Verfolgung spezifischer Unternehmen, Analyse geografischer Abdeckung oder Aufbau von Wissensdiagrammen aus Nachrichteninhalten.
- Die API gibt beide Felder zurück: Beschreibung (Zusammenfassung/Auszug) und Text (vollständiger Artikeltext). Das Textfeld enthält den vollständig bereinigten Artikelinhalt ohne HTML. Einige Artikel hinter Bezahlschranken können eingeschränkten Textinhalt haben - überprüfen Sie die Paywall-Markierung. Vollständiger Textzugang ist in allen Tarifen enthalten, ohne Zusatzkosten.
Strukturierte Nachrichten-Daten-API: Über rohe Artikel hinaus
APITube liefert strukturierte Nachrichtendaten mit konsistenten Schemas aus über 500.000 Quellen. Jeder Artikel enthält normmialisierte Felder: Titel, Text, Veationrö,metadatenadatenende NLP-Anreicherung.
Anreicherungsfelder umfassen Sentimentwerte (positiv/negativ/neutral), extrahierte Entitäten (Personen, Organisationen, Orte, Marken), Themen- und Kategorienklassifizierung, Branchentags und Lesbarkeitsmetriken. Storyclusterung gruppiert verwandte Artikel automatisch.
Für Dateningenieure und Analysten beseitigt strukturierte Ausgabe Parsing-Komplexität. Konsistente JSON-Schemas arbeiten direkt mit Datenbanken, Analyseplattformen und ML-Pipelines. Export zu CSV, XLSX oder XML für Tabellenkalkulationsprogramme und BI-Tool-Integration.