
Ein Shop, zwei Bewertungsportale – und zwei Welten. Was auf Judge.me wie eine makellose Erfolgsstory glänzt, wirkt auf Trustpilot wie ein Kundenhorror. Wir erklären, warum Netz-Trends.de die Sterne auf Judge.me für irreführend hält.
Stand: 14. September 2025 (Europa/Berlin). Dieser Beitrag stützt sich auf Primärquellen, die am Ende verlinkt sind.
Kommentar - Auf Judge.me präsentiert sich Orthoback mit 4,80 von 5 Sternen bei 13.383 veröffentlichten Reviews; Judge.me kennzeichnet dort „Verified“ (Bestellabgleich) und „Review collected from invite“ (Einladungs-Mail nach Kauf). In mehreren Orthoback-Produktthreads ist diese Einladungskennzeichnung sichtbar. Zudem bietet Judge.me nach eigener Dokumentation Coupon-Belohnungen („rewarded with a coupon“) als Anreiz für das Abgeben von Reviews an. Das erhöht zwar die Menge der Bewertungen – kann aber die Tonalität verzerren. (Judge.me)
Auf Trustpilot ergibt sich für orthoback.de ein ganz anderes Bild: 7.956 Bewertungen, TrustScore 2,5/5 („Poor/Mangelhaft“) – mit 41 % Ein-Sterne und 41 % Fünf-Sterne (auffällig polarisierte Verteilung). In den jüngsten Textberichten häufen sich Vorwürfe zu nicht gelieferter oder mangelhafter Ware, ignorierten Widerrufen, Inkassoschreiben und Retouren nach China. (Trustpilot)
Kurz: Auf Judge.me dominiert Hochglanz-„Social Proof“. Auf Trustpilot dominiert Problemberichterstattung.
Einladungs- und Anreizlogik (systematischer Bias)
Judge.me ist ein Review-Sammel- und Anzeige-Werkzeug für Shops. Bewertungen werden typischerweise per E-Mail unmittelbar nach dem Kauf angefordert („invite“). Nutzer können dabei Sternchen ohne Text hinterlassen; Händler dürfen vor Veröffentlichung moderieren und – mit Begründung – Reviews verbergen. Judge.me bietet außerdem automatisch generierte Coupon-Codes als Belohnung an; der Badge „incentivized“ kann angezeigt werden. In Summe erzeugt das Menge – aber keine neutrale Stichprobe. (Judge.me)
Gegencheck: Trustpilot verbietet incentivierte Reviews ausdrücklich; die Plattform ist offen (auch ohne Einladung) und untersagt Cherry-Picking. Das senkt die Eingriffs- und Filtermöglichkeiten von Händlern und erklärt, warum dort Kritik sichtbarer wird. (Trustpilot)
Timing-Effekt (Bewerten, bevor man wirklich testen konnte)
Invite-Mails werden bei Judge.me oft schon kurz nach dem Kauf oder unmittelbar nach der Lieferung verschickt. Dadurch entstehen viele sogenannte Erst-Eindruck-Bewertungen, die im Schnitt deutlich positiver ausfallen als Rezensionen nach längerer Nutzung. In nicht wenigen Fällen hatten Käufer das Produkt zum Zeitpunkt der Sterneabgabe vermutlich noch gar nicht getestet – viele wohl nicht einmal physisch erhalten, da die Bewertungseinladung schon direkt nach dem Bezahlvorgang eintrifft. Auf Trustpilot dagegen tauchen vor allem spätere Erfahrungsberichte auf, in denen von Defekten, Garantieproblemen, komplizierten Rücksendungen nach China oder Inkasso-Fällen berichtet wird. Das führt zu einer systematischen Verzerrung: Judge.me sammelt überwiegend frühe, freundlich gefärbte Bewertungen, während Trustpilot den Langzeitfrust vieler Kunden dokumentiert. Belegbar ist das unter anderem an den Invite-Hinweisen in den Orthoback-Threads (Judge.me).
Vor-Filter gegen Negativ-Reviews (Soft-Gating)
Judge.me bietet eine Funktion, vor dem Absenden einer Niedrig-Sterne-Bewertung eine Support-Kontaktseite einzublenden („help screen before a negative review is submitted“). Das ist legitim – senkt aber die Zahl tatsächlich abgesendeter Negativ-Reviews in diesem Kanal. Google untersagt „Review-Gating“ in seinen Richtlinien; Trustpilot untersagt Anreize. Der Mechanismus illustriert, warum Shop-eigene Review-Kanäle glatter wirken. (Judge.me)
Google-Shopping-Anreize (Quantität schlägt Qualität)
Für Sternchen in Google Shopping gilt: Es braucht mindestens 50 Produktreviews (gesamt). Judge.me unterstützt die XML-Feeds ins Merchant Center – Shops haben also ein starkes Motiv, schnell viele positive Sterne zu generieren, damit die Sterne in Anzeigen erscheinen. Das ist für Performance-Marketing ideal – für die Aussagekraft der Reviews aber heikel. (Google Hilfe)
Seit Umsetzung der EU-Omnibus-Richtlinie (EU) 2019/2161 in deutsches Recht gilt § 5b Abs. 3 UWG: Wer mit Verbraucherbewertungen wirbt, muss informieren, ob und wie die Echtheit sichergestellt wird (z. B. „nur verifizierte Käufer“, Prüfmechanik, Ausschlusskriterien). Verstöße können irreführend sein. (EUR-Lex)
Zugleich hat der BGH (20. 02. 2020 – I ZR 193/18) klargestellt: Händler haften nicht automatisch für irreführende Kundenbewertungen auf unabhängigen Plattformen; Bewertungen genießen Grundrechtsschutz. Das schützt Meinungsäußerungen – entbindet Händler aber nicht von Transparenzpflichten, wenn sie aktiv mit Bewertungen werben. (Bundesgerichtshof)
Konsequenz: Ein Shop-eigenes Review-System mit Einladungen, Incentives und Vor-Filtern kann zwar rechtskonform betrieben werden – liefert aber kein neutrales Stimmungsbild. Wer die Sterne werblich herausstellt, muss sauber erklären, wie sie zustande kommen.
Gründer/CEO ist Peter-Jan (PJ) Celis. Die operative Gesellschaft JUDGE.ME LTD ist in London registriert (Company No. 12157706). Das deckt sich mit externen Unternehmensprofilen und Companies-House-Datensätzen. (LinkedIn)
Erstens: Der Invite-Bias plus Anreiz-Mechanik auf Judge.me erzeugt viele kurze, freundliche Sterne – häufig ohne Substanz. Zweitens: Die Vor-Kontakt-Funktion reduziert abgeschickte Negativ-Reviews. Drittens: In unabhängigen Kanälen (Trustpilot) kumuliert sich die Problemkommunikation rund um Lieferung, Qualität, Widerruf, Inkasso – also genau das, was im Shop-eigenen Kanal abgefedert wird. Viertens: Der Marketing-Anreiz (Sterne in Google-Ads) verstärkt die Mengen- statt Qualitätslogik im Shop-System. Zusammen erklären diese Faktoren, warum 13.383 „glänzende“ Judge.me-Sterne eine andere Wirklichkeit abbilden als 7.956 weit kritischere Trustpilot-Stimmen. (Judge.me)
Erstens: Judge.me-Sterne bei Shop-Einbettungen nicht mit unabhängiger Kundenerfahrung verwechseln.
Zweitens: Immer einen Zweit-Check auf unabhängigen Plattformen (z. B. Trustpilot) durchführen und dort Texte lesen, nicht nur Sternchen zählen.
Drittens: Bei werblicher Nutzung von Sternen auf Shop-Seiten sollten Unternehmen § 5b Abs. 3 UWG ernst nehmen und konkret erklären, wie Verifizierung, Einladungen, Incentives und Moderation funktionieren. (omsels.info)
Die Orthoback-Sterne auf Judge.me sind aus unserer Sicht kein belastbares Abbild echter Kundenerfahrungen, sondern das Resultat einer shop-getriebenen Sammel- und Anreizlogik. Für Verbraucherorientierung und journalistische Bewertung sind unabhängige Plattformen mit klaren Anti-Incentive-Regeln (wie Trustpilot) aussagekräftiger.
Quellen (Primär & Richtlinien)
Orthoback auf Trustpilot: Live-Profil mit 7.956 Reviews, TrustScore 2,5/5; aktuelle Bewertungsverteilung und Beispiele. (Trustpilot)
Orthoback auf Judge.me: Öffentliche Store-/Produkt-Reviews (u. a. „Review collected from invite“ sichtbar). (Judge.me)
Judge.me – Coupons & Transparenz-Badges: Offizielle Hilfeseiten (Incentives, Kennzeichnung, Moderation/Hide). (Judge.me)
Judge.me – Web-Review-Restriktion (nur eingeladene Käufer): Admin-Option. (Judge.me)
Judge.me – „Help screen before a negative review“: Vorstufe bei Niedrig-Sterne-Eingaben. (Judge.me)
Trustpilot – Regeln gegen Incentives / Cherry-Picking: Richtlinien für Reviewer & Businesses. (Trustpilot)
Google Product Ratings (50-Review-Schwelle): Merchant-Center-Dokumentation & Judge.me-Hilfe zur Google-Anbindung. (Google Hilfe)
EU-Omnibus-Richtlinie / § 5b Abs. 3 UWG: EUR-Lex & juristische Fachkommentierung. (EUR-Lex)
BGH 20.02.2020 – I ZR 193/18 (Amazon/Kundenbewertungen): Pressemitteilung/Entscheidungshinweise. (Bundesgerichtshof)
Judge.me – Unternehmensdaten & Gründer: LinkedIn-Profil PJ Celis; Companies-House-Register JUDGE.ME LTD (London). (LinkedIn