Wie tgadsspy funktioniert: Technischer Deep Dive in Klassifikator und Ingest-Pipeline
Technische Dokumentation der tgadsspy-Datenpipeline — gramesh API-Integration, Nischen-Klassifikationsarchitektur (Regex + Gewichtungen), Geo-Klassifikator-3-Stufen-Pipeline, SHA256-inhaltsadressierter Medienspeicher und Aggregations-Caching. Für Entwickler, Forscher und Compliance-Teams.
Zweck und Zielgruppe#
Dieses Dokument ist ein technischer Deep Dive in die Funktionsweise von Telegram Ads Spy: Datenbeschaffung, Klassifikation und Bereitstellung von Telegram-Werbedaten. Es ergänzt die Übersicht unter /about mit Details auf Implementierungsebene.
Primäre Zielgruppe: Entwickler, die auf der öffentlichen API aufbauen; Forscher, die die Datenprovenienz zur Zitation verstehen müssen; und Compliance-Teams, die die OSINT-Methodik des Systems beurteilen.
1. Datenquelle: gramesh API#
Alle Werbedaten in Telegram Ads Spy stammen aus einer einzigen Quelle: der gramesh HTTP API unter api.wall.systems/gramesh. gramesh ist eine Proxy-/Aggregationsschicht über Telegrams MTProto-Protokoll.
Verwendete Endpunkte#
POST /channels.getSponsored— ruft gesponserte Nachrichten für einen Kanal abPOST /channels.getInfo— löst Kanalmetadaten aufPOST /channels.getSimilar— BFS-Spider für Similarity-GraphenPOST /contacts.search— Entdeckt neue Kanäle nach Suchquery
2. Nischen-Klassifikation#
Jeder AdCreative wird einer Nische aus ~25 Kategorien zugewiesen: sports-betting, crypto-exchange, defi, forex-trading, p2p-crypto, gambling, edtech, real-estate und andere. Die Klassifikation erfolgt in lib/niche.ts per Regex-Regeln auf Titel + Text + CTA-URL.
Architektur: Regeln mit Gewichtungssystem — starke Treffer (z.B. "1xBet" → sports-betting) vergeben Punkte 3–5; schwache Treffer (generische Finanzterminologie) 1–2. Die Nische mit dem höchsten Gesamtscore gewinnt.
3. Geo-Klassifikation#
Drei-Stufen-Pipeline:
- Channel language →
langToGeo()Mapping (ru → RU/UA/KZ/BY, ar → SA/EG/AE/…) - CTA URL → TLD-Extraktion (
.de→ DE,.com.br→ BR) - Creative text → Währungsmuster, Städtenamen, regulatorische Referenzen
4. Medien-Mirror#
gramesh liefert vorzeichenbehaftete URLs mit 1-Stunden-TTL. Der Mirror-Cron (Telegram Ads Spy-media-mirror, alle 5 min):
- Lädt die Mediendatei herunter
- Berechnet SHA256-Hash
- Speichert unter
/var/www/tgadsspy-media/<präfix>/<hash>.<ext> - Aktualisiert
AdCreative.mediaUrl→ permanente/m/<hash>.<ext>URL
Methodik-Referenz#
Vollständige Methodik-Dokumentation: tgadsspy.com · API: /api/v1/ads. CC-BY-4.0.
Live-Daten via Telegram Ads Spy
Telegram Ads Spy indexiert alle gesponserten Telegram-Anzeigen in Echtzeit. Entdeckte Creatives können unter tgadsspy.com/ads durchsucht oder über die offene API /api/v1/ads exportiert werden.
Datenzugang: tgadsspy.com · CC-BY-4.0.
Disponibile anche in:
Cita questo articolo
tgadsspy research (2026). Wie tgadsspy funktioniert: Technischer Deep Dive in Klassifikator und Ingest-Pipeline. tgadsspy.com. Retrieved from https://tgadsspy.com/blog/de-tgadsspy-methodik-klassifikator-pipeline-2026
Licenza CC-BY-4.0 — riutilizzo consentito incluso quello commerciale, attribuzione richiesta.