16 kwietnia 2026 Anthropic udostępnił Claude Opus 4.7 — najmocniejszy ogólnodostępny model w rodzinie Claude. Premiera objęła aplikacje Claude, Claude Code, publiczne API oraz Amazon Bedrock, Vertex AI i Microsoft Foundry. Cena za tokeny bez zmian, ale benchmarki kodowania, rozdzielczość obrazu i głębia rozumowania wyraźnie podskoczyły. Rozbieramy Opus 4.7 na części — od SWE-bench Pro przez xhigh po realne konsekwencje dla pracy w SEO.
Co zmieniło się w Claude Opus 4.7 w porównaniu z 4.6?
Opus 4.7 daje lepsze kodowanie agentowe, ponad trzykrotnie większą rozdzielczość obrazu i nowy poziom rozumowania xhigh — przy cenie identycznej jak Opus 4.6.
Na wewnętrznym benchmarku Hex z 93 realnymi zadaniami developerskimi Opus 4.7 rozwiązał o 13% więcej niż Opus 4.6, w tym cztery, z którymi nie poradził sobie ani poprzednik, ani Sonnet 4.6 — zadania wymagające wcześniej ręcznej interwencji. W publicznych testach: SWE-bench Verified 87,6%, SWE-bench Pro 64,3%, CursorBench skoczył z 58% (Opus 4.6) do 70%.
Najważniejsze różnice Opus 4.7 vs 4.6:
- Benchmark Hex (93 zadania): +13% skuteczności, w tym cztery zadania nierozwiązywalne dla poprzedników.
- Rozdzielczość obrazu: z 1,15 MP (1568 px) do 3,75 MP (2576 px) — wzrost ponad trzykrotny.
- Nowy poziom xhigh między „high” a „max”, domyślny w Claude Code.
- Ta sama cena: 5 USD za milion tokenów wejściowych, 25 USD wyjściowych.
Dla zespołów z workflow na Opus 4.6 migracja wygląda jak „free upgrade” — ten sam koszt jednostkowy, wyższa skuteczność. Z naszego doświadczenia to cicha, ale istotna zmiana: nie trzeba przepisywać promptów ani narzędzi, żeby zobaczyć poprawę.

xhigh i 3,75 megapiksela — techniczne nowości Opus 4.7
Opus 4.7 wprowadza nowy poziom rozumowania xhigh między „high” a „max” i potraja maksymalną rozdzielczość obrazu wejściowego — z 1,15 MP do 3,75 MP.
Jak działa xhigh effort level?
xhigh to nowy poziom głębi rozumowania plasowany między „high” a „max” — domyślny w Claude Code i rekomendowany dla zadań agentowych oraz trudnego kodowania.
Wcześniej użytkownik wybierał między minimal, low, medium (szybko i tanio), high (pogłębione rozumowanie) oraz max (najgłębsze, ale kosztowne). „High” bywał za płytki na złożone zadania inżynierskie, a „max” — zbyt powolny dla produkcji. xhigh wypełnia tę lukę: głębsze rozumowanie niż „high”, bez pełnego kosztu „max”. Anthropic rekomenduje start od „high” lub „xhigh” dla kodowania, a „max” rezerwować na najtrudniejsze problemy. Ograniczenie: dłuższy czas odpowiedzi i większe zużycie tokenów wyjściowych — przy formatowaniu kodu czy boilerplate warto schodzić niżej.
Co zmienia trzykrotnie większa rozdzielczość wizji?
Nowy model analizuje obrazy do 2576 px na dłuższym boku (≈3,75 MP) — ponad trzykrotnie więcej niż 1568 px (1,15 MP) w Opus 4.6.
Przyrost nie jest kosmetyczny. U partnera wczesnego dostępu zajmującego się autonomicznymi testami penetracyjnymi skuteczność wizualna wzrosła z 54,5% (Opus 4.6) do 98,5% (Opus 4.7) na tym samym zadaniu. Na CharXiv — benchmarku rozumowania nad wykresami naukowymi — Opus 4.7 osiąga 82,1% bez narzędzi i 91,0% z narzędziami. Dla agencji SEO to konkret: zrzut strony z Core Web Vitals, raport audytu czy schemat architektury serwisu można oddać modelowi w jednym ujęciu, zamiast ciąć na kawałki. Koszty bez zmian — to samo API, ten sam cennik, większe okno wizualne.

Jak wypada Opus 4.7 na tle Mythos Preview i konkurencji?
Opus 4.7 jest najmocniejszym ogólnodostępnym modelem Anthropic, ale nie najmocniejszym w katalogu — Mythos Preview pozostaje pod zamknięciem dla wybranych partnerów.
Anthropic przyznaje, że Mythos Preview wypada lepiej na większości benchmarków, ale świadomie ogranicza dystrybucję — dostęp mają wybrane firmy z sektora cyberbezpieczeństwa i technologii, po formalnej weryfikacji. Podczas treningu Opus 4.7 zespół próbował „różnicowego zredukowania” zdolności cyberofensywnych modelu. Na tle publicznej konkurencji Opus 4.7 „odzyskuje koronę” najmocniejszego ogólnodostępnego LLM — wyprzedza GPT-5.4 i Gemini 3.1 Pro w większości testów agentowych i kodowania. Publiczne wyniki:
| Benchmark | Wynik Opus 4.7 | Kategoria |
| SWE-bench Verified | 87,6% | Kodowanie realnych zadań |
| SWE-bench Pro | 64,3% | Kodowanie trudne |
| MCP-Atlas | 77,3% | Użycie narzędzi w skali |
| OSWorld-Verified | 78,0% | Computer use / agent |
| CharXiv (z narzędziami) | 91,0% | Rozumowanie wizualne |
Warto czytać te liczby z pokorą. Różnice między czołowymi modelami są jedno- lub dwupunktowe — o jakości codziennej pracy decyduje nie wskaźnik w arkuszu, ale to, jak model radzi sobie z workload’em Twojego zespołu.
Ile kosztuje Claude Opus 4.7 i gdzie jest dostępny?
Opus 4.7 kosztuje 5 USD za milion tokenów wejściowych i 25 USD za wyjściowe — bez zmian vs 4.6 — i działa w Claude, API oraz trzech głównych chmurach.
„Same price, better performance” oznacza konkretne oszczędności. Migracja z Opus 4.6 bez zmian w workflow daje +13% skuteczności na kodowaniu i trzykrotnie większą rozdzielczość wizji za tę samą stawkę. Koszt na zrealizowane zadanie (nie na token) spada dokładnie o tyle, o ile rośnie skuteczność modelu. Subskrybenci Claude Pro, Max, Team i Enterprise mają model od 16 kwietnia 2026, deweloperzy korzystają przez API, a klienci chmurowi — przez natywne integracje w Amazon Bedrock, Vertex AI i Microsoft Foundry. W Claude Code Opus 4.7 jest domyślny z poziomem xhigh, bez ręcznej aktualizacji.
Zastrzeżenie dotyczy kontekstu regulacyjnego. Firmy z UE korzystające z Bedrock lub Vertex AI powinny zweryfikować, w których regionach model jest dostępny i czy procesowanie danych odbywa się na terenie EOG — Anthropic nie publikuje tej mapy w komunikacie premierowym, a w 2026 roku wymaga tego RODO i AI Act. Dla pipeline’u obsługującego sektor regulowany to pierwsze pytanie do operatora chmury.
Co Opus 4.7 oznacza dla SEO i content marketingu?
Opus 4.7 nie jest modelem SEO, ale lepsze rozumowanie, wizja 3,75 MP i dłuższa praca agentowa realnie podnoszą jakość pracy z treścią.
Zastosowania w codziennej pracy agencji wyglądają teraz inaczej. Praca z danymi wizualnymi zmieniła się najbardziej — zrzuty z Search Console, Ahrefs, Senuto czy Screaming Frog można podawać w całości, bez cięcia na kawałki. Dłuższe sesje agentowe: research konkurencji obejmujący 10-15 URL-i, budowa klastra tematycznego czy audyt profilu linkowego przestaje rozpadać się z powodu „drift’u”. Jakość generowanej treści informacyjnej podskoczyła — przy briefach YMYL Opus 4.7 rzadziej „ucieka” w generyczny ton i częściej trzyma się danych z briefu.
Znane ograniczenia nie zniknęły:
- Halucynacje na świeżych wydarzeniach — cutoff treningowy nie zastąpi web searcha.
- Nadmierna pewność w YMYL — generuje autorytatywnie brzmiące fragmenty bez pokrycia; korekta eksperta obowiązkowa.
- Wysokie koszty automatyzacji — 25 USD za milion tokenów wyjściowych to kilka tysięcy złotych miesięcznie.
- Niuanse polskiego SEO (odmiana fraz, lokalny kontekst) wymagają polskiego copywritera przy finalnej redakcji.
Najlepsze wyniki daje hybrydowy workflow: research i draft na Opus 4.7, korekta i fact-check przez człowieka, weryfikacja E-E-A-T na końcu. To podejście stosujemy w treściach pod AI Overviews i audytach contentowych dla klientów B2B. Dla zespołów rozważających automatyzację pomocny jest przegląd narzędzi AI w pracy SEO. Jeśli Opus 4.7 przeniesie Twój workflow na wyższy poziom jakości i przyspieszy go naraz — migracja z 4.6 jest oczywista, bo nic nie kosztuje.

