Mariusz Gąsiewski

Sandbox, Trustbox i filtry

Tematowi mitycznego Sandboxa (który tak naprawdę powinien nazywać się Trustboxem) Google poświęcono już setki publikacji i dyskusji. Trudno jest nawet potwierdzić w 100% istnienie tego elementu algorytmu Google i jego dokładne działanie. Jest pewne, że Sandbox (plus filtry Google) istnieją w postaci okresu inicjacyjnego nałożonego przez algorytm Google na nowe strony i tzw. „mało zaufane strony”, w wyniku czego nie mogą one uzyskiwać wysokich rankingów w wynikach wyszukiwania.

W poniższym artykule będę trochę mieszał ze sobą pojęcia Sandboxa, filtrów i Trustboxa. Jak już wspominałem nie wiadomo, czy Sandbox kiedykolwiek istniał i jaką postać ma on obecnie. Na pewno istnieją filtry, które wręcz będą łączył z Sandboxem, rozszerzając znaczenie tego pojęcia.

Jak powstał Sandbox i czym jest?

Sam Sandbox po raz pierwszy pojawił się w marcu 2004 roku wraz z słynnymi zmianami w algorytmie Google, znanymi pod nazwą „Austin Update”.

Przed tymi zmianami częstą praktyką było tworzenie optymalizowanych pod wyszukiwarki spamerskich stron internetowych, które szybko były indeksowane przez Google i szybko pięły się na wysokie pozycje w wynikach wyszukiwania. Strony to następnie były usuwane z indeksu Google przez jego pracowników, jednak pomimo dość krótkiego żywota takich stron, ich zakładanie stało się dość zyskownym interesem (koszt stworzenia takiej strony był dużo niższy niż zyski zdobywane w ciągu kilku tygodni istnienia takiej strony). Aby zaradzić tej sytuacji inżynierowie Google wprowadzili do algorytmu Google dodatkowy element, oceniający wiarygodność i zaufanie danej witryny internetowej, czyli właśnie Sandbox.

Zadaniem Sandboxa stało się sprawdzanie, które z stron internetowych, znajdujących się w indeksie Google są na tyle„podejrzane” , że wymagają „specjalnego traktowania” ze strony Google. W swoim założeniu Sandobox ma za zadanie pomijać w ustalaniu rankingu linki z określonym anchor tekstem i dopiero po określonym czasie nadawać im znaczenie (dopiero wtedy, kiedy uzna, że są one godne zaufania).

Algorytm Google

Algorytm Google, którego częścią jest Sandbox, ocenia wartość danej strony na podstawie jej treści, wieku i historii oraz linków prowadzących z innych stron do niej. Algorytm ten jest wzorowany na zasadach, jakie rządzą publikacjami naukowymi: im więcej prac naukowych odwołuje się do danej publikacji naukowej, tym większe znaczenie dla danego tematu ma ta publikacja. Z tego względu też algorytm ocenia słabiej nowe domeny internetowe (jest małe prawdopodobieństwo, że dopiero co powstała publikacja naukowa ma duże znaczenie dla danego tematu), domeny, które odwołują się do kiepskich stron internetowych (autorzy dobrych publikacji naukowych dbają o swoją reputację, więc nie cytują w swoich dziełach słabych publikacji), strony internetowe, które często zmieniają swoja tematykę (prawdziwi eksperci tworzą publikacje naukowe tylko o podobnej tematyce), uznając, że ich wysokie pozycje w wynikach wyszukiwania są wynikiem pozycjonowania i kupowania linków .

Najważniejsze elementy filtrów określanych mianem Sandbox:

  • Sandbox (i filtry ) jest bezpośrednio związane z poziomem zaufania Google do strony (nieraz wręcz używa się dla niego terminu TrustBox).
  • Ma związek z tzw. Fresh Site Bonus, czyli krótkotrwałym wzrostem pozycji nowej strony w wynikach wyszukiwania, a następnie głębkiego spadku strony (najprawdopodobniej celem tego procesu jest sprawdzenie naturalności linków zdobywanych przez daną stronę i i rozłożenia zdobywania tych linków w czasie).
  • Dotyka całe domeny i serwisy, nie poszczególne podstrony czy subdomeny.
  • Ma bezpośredni związek z tzw Duplicate Content, wynikającego z niewłaściwego linkowania (dwie lub więcej podstron o takiej samej treści pod różnymi adresami) lub też duplikowania treści tytułów i metatagów (meta description, meta keywords i Title podstron w obrębie serwisu są takie same lub bardzo podobne do siebie) .
  • Dotyka najczęściej domen zarejestrowanych po 2003 roku; szczególnie często dotyka stron całkowicie nowych i bardzo krótko istniejących w sieci.
  • Dotyczy głównie serwisów internetowych stosujących techniki optymalizacyjne i pozycjonerskie (zwłaszcza te ostatnie) na popularne frazy wyszukiwania. Im na bardziej popularne słowa kluczowe jest optymalizowany dany serwis tym większe jest prawdopodobieństwo jego „ukarania” przez Google Sandboxem i filtrami. Sandbox dotyczy również mało popularnych fraz.
  • Sandobox dotyczy oczywiście tylko wyszukiwarki Google, aczkolwiek ostatnie doniesienia z WebmasterWorld pokazują, że inne wyszukiwarki takie jak: Yahoo.com i MSN również posiadają już swoje filtry w ustalaniu rankingu wyników wyszukiwania.
  • Sandbox powoduje zniknięcie strony z wyników wyszukiwania; nie dotyczy jednak wyszukiwań z użyciem bardziej zaawansowanych operatorów Google – np. allinanchor, allintitle
  • Wysokie prawdopodobieństwo wpadnięcia w Sandbox i filtry na określone słowa kluczowe mają strony afiliacyjne, witryny stworzone specjalnie dla reklamy kontekstowej, strony stosujące spam.
  • Sandobox dotyczy tylko sektora komercyjnego, w mniejszym stopniu dotyka domeny .org niż .com, .biz czy też domeny narodowe – nigdy nie zanotowano Sandbox w przypadku domen .mil, .edu i .gov.
  • Długość trwania Sandboxa jest różna – od miesiąca do roku, przy czym najczęściej jest to około 3 miesięcy. Trzeba też wiedzieć, że strony są uwalniane z Sandboxa grupowo – po prostu pewnego dnia update algorytmu Google uwalania określona ilość stron.

Kiedy wiadomo, że moja strona wpadła w Sandbox?

Stwierdzenie Sandboxa nie jest wcale łatwe. Google w żaden sposób nie informuje o tym webmasterów i właścicieli stron. Z doświadczeń webmasterów, którzy dzielą się nimi na łamach forów internetowych wynika, że w następujących sytuacjach możemy z dużą dozą prawdopodobieństwa mówić o występowaniu Sandboxa lub filtrów:

  • Strona internetowa jest bardzo wysoko w innych wyszukiwarkach niż Google, ale nie pokazuje się w ogóle w wynikach wyszukiwania Google.
  • Strona internetowa jest bardzo wysoko w wynikach wyszukiwania z użyciem operatorów zaawansowanych, ale nie ma jej w ogóle w wyszukiwaniu prostym.

Aby witryna internetowa mogła uniknąć działania filtrów i Sandboxa (lub też wydostać się z nich w sytuacji, kiedy się tam dostała ) musi „zdobyć zaufanie” wyszukiwarki Google.

Najlepszy sposób na „zdobycie tego zaufania” to:

  • Zastosowanie do budowy serwisu jakiejś innej, starej domeny, która dużo szybciej „zdobędzie zaufanie” Google. Serwis z starą domeną zostanie dużo szybciej zindeksowany niż serwis z nową domeną. Po kilku miesiącach, kiedy już nowa ( i jednocześnie docelowa )domena osiągnie odpowiednią wartość można przenieść serwis na nową domenę, tworząc dla podstron zindeksowanych w wyszukiwarkach przekierowanie 301 na nową lokalizację w nowej domenie).
  • Stworzenie wartościowej strony internetowej; użytecznej dla użytkowników; mającej profesjonalny i unikalny design, do której będą w naturalny sposób linkować Internauci.
  • Wiązanie działalności komercyjnej z niekomercyjną; przykładowo jeżeli chcesz stworzyć stronę sprzedającą telefony komórkowe, zacznij od stworzenia wartościowej treści, związanej z tym tematem – bloga, forum, bazy wiedzy na temat telefonów i ich użytkowania.
  • Zdobycie wartościowych linków z stron, które Google uznaje za wartościowe i które są tematycznie powiązane z naszą stroną.

Jak zdobywać wartościowe linki ?

  • Dodanie witryny do najlepszych (nierzadko też darmowych ) katalogów takich jak: DMOZ, Business.com, Katalog Onetu, Katalog WP. Szczegółowy wykaz polskich katalogów można znaleźć na katalogiseo.info
  • Dodawanie treści z linkami do naszego serwisu do stron internetowych, które zezwalają na dodawanie treści przez użytkowników
  • Tworzenie treści w Wikipedii i squidoo.com. W tej sytuacji nie ma sensu dodawanie linku do naszej strony do najbardziej konkurencyjnych sekcji Wikipedii – nasza treść nie wniesie tam nic nowego i wartościowego i szybko zostanie uznana za spam (np. jeżeli chcemy promować stronę o kredytach hipotecznych nie dodajemy treści z linkiem do strony do sekcji www.pl.wikipedia.org/wiki/Kredyt_hipoteczny tylko tworzymy w Wikipedii nową sekcję dotyczącą kredytu denominowanego lub też obliczania wysokości odsetek w kredycie hipotecznym. Następnie tworzymy podstronę w naszym serwisie, dotyczącą kredytu denominowanego w kredytach hipotecznych i linkujemy ją z stworzonej przez nas nowej sekcji w Wikipedii.
  • Dodawanie artykułów do nowych serwisów społecznościowych takich jak: www.IThink.pl, www.Elans.pl – linki do naszego serwisu muszą być jednak umieszczane w taki sposób, aby nie łamały regulaminów tych serwisów. W artykułach warto linkować do promowanej strony z stopek artykułów (stopka artykułu jest uznawane za najbardziej naturalne miejsce dla linka do zewnętrznej strony –analogia do publikacji internetowej, gdzie na końcu publikacji jest odwołanie do witryny autora lub miejsca pochodzenia publikacji )
  • Tworzenie tzw. presell pages, czyli stron stworzonym i udostępnionych przez inne serwisy, na których możemy umieścić linki do podstroi w naszym serwisie. Linki z dobrej presell page powinny być otoczone treścią podobną do treści, znajdującą się na stronie, do której wychodzą linki. Ostatnio powstają wręcz serwisy, których zadaniem jest umożliwianie tworzenie presell pages (np. www.seobiblioteka.pl). Aby wzmocnić działanie presell pages warto użyć tzw. zjawiska anchorPR, czyli skierować na presell pages kilka linków z takim samym anchor tekstem, z jakim wychodzą linki pozycjonujące z presell page do promowanej witryny internetowej – wówczas siła linków przechodzi na kolejne strony).
  • Wykorzystywanie serwisów typu www.wykop.pl, www.del.icio.us dodawania linków do naszych serwisów. W tej sytuacji warto wręcz wykorzystać znajomych, którzy mają konta w takich serwisach, aby promować dodawane linki (wartość linku z www.wykop.pl/popularne jest dużo bardziej wartościowy niż z www.wykop.pl)
  • Tworzenie powiązanych tematycznie stron,z których będziemy mogli linkować.
  • Kupno linków w wartościowych i powiązanych tematycznie stronach internetowych.

Trwają spekulacje odnośnie tego, czy na wychodzenie witryn internetowych z Sandboxa wpływ mają dane dostarczane przez toolbary Google. Jak wynika jednak z doświadczeń użytkowników forum Webmasterworld.com i wypowiedzi Matta Cutts dane te nie powinny mieć żadnego wpływu na kwestie filtrów i oceniania witryn internetowych przez Google.

Mam nadzieję, że nie zakręciłem za bardzo w tym poście i jest on w miarę zrozumiały :).

Polecam wszystkim bardzo ciekawą dyskusję na WebmasterWorld.com dotyczącą Sandboxa.

W przypadku, kiedy uznasz strone za przydatna dodaj na swojej stronie link do niej.
Po prostu skopiuj i wklej link podany nizej (Ctrl+C to copy)
Wyglad linku po wklejeniu na stronie: Sandbox, Trustbox i filtry

Dodaj link do:
| | | Y! MyWeb | +Google

14 komentarzy to “Sandbox, Trustbox i filtry”

  1. phpon 06 sty 2007 at 18:26

    Ostatnio pojawiły się spekulacje, że google gorzej traktuje strony, które zostały wypozycjonowane przez różne rodzaje katalogi, więc raczej radziłbym się skupić na naturalnym pozycjonowaniu 😉

  2. adminon 06 sty 2007 at 18:48

    Masz rację. Sam odczułem to ostatnio trochę na własnej skórze 🙂
    Według mnie to dobra droga. Koniec końcem to walka o pozycje w wynikach wyszukiwania powinna się odbywać na poziomie treści stron. Czy np. jakiś mój serwis miałby być lepszy od innego tylko dlatego, że ja wiedziałem, że można go dodać do kilku katalogów? Według mnie prawdziwe pozycjonowanie (tak naprawdę cała strategia zdobywania użytkowników poprzez wyszukiwarki) powinna wychodzić z prób dostarczenia użytkownikowi lepszej treści niż inni (lub też podobnej, ale w lepszy sposób). Przecież można próbować pozycjonować śmieciowe serwisy, ale przecież każde pozycjonowanie jest tylko jedną z dróg zdobycia użytkownika i przekonania go do zakupu, zapisania się na coś i itp. Co z tego, że przyciągnie się użytkownika, ale tylko na 15 sekund 🙂
    A co Ty o tym sądzisz?

    P.S. Jak możesz sprawdzić tę stronę dodałem na razie tylko do 5-8 katalogów. 🙂

  3. ff0uron 10 sty 2007 at 21:28

    Moja strona jakiś czas temu na wszystkie hasła spadła na 31 pozycje, a na pierwszych pozycjach trzymała się prawie rok. Teraz jest na 61 pozycji. To jakiś nowy filtr?

  4. adminon 10 sty 2007 at 21:53

    Czy czytałeś ten post? Bardzo możliwe, że to jest to

    http://www.ittechnology.us/2006/12/14/paragraf-31-w-google/

  5. Wyniki uzupełniające w Googleon 17 sty 2007 at 01:22

    […] W tym przypadku najlepszym rozwiązaniem jest skierowanie na podstrony pokazywane jako wyniki uzupełniąjące linki jak najwyższej jakości (uwaga – ważna jest jakość tych linków, a nie ich ilość). Sposoby na zdobycie dobrej jakości linków można znaleźć w poście Sandbox, Trustbox i filtry. […]

  6. Wskazówki Google dla webmasterówon 06 lut 2007 at 20:24

    […] Sandbox opisany w Sandbox, Trustbox i filtry; […]

  7. kedzioraon 21 lut 2007 at 13:28

    inne presell pages + feed do generowania automatycznych stron pod dane słowa kluczowe http://www.grabtext.org

  8. […] W tej sytuacji sprawa walki o pozycje w wynikach wyszukiwania Google sprowadza się do posiadania wartościowej domeny, której Google przydzielił wysoki TrustRank (same zagadnienie TrustRanku możesz poznać czytając mój post Sandbox, Trustbox i filtry). Z tego względu też tak trudno jest pozycjonować w Google nową domenę, ponieważ Google „nie ufa” jej. […]

  9. Mietekon 20 mar 2009 at 15:37

    Świetny artykuł. Tylko dwie rzeczy – linki w Wikipedii już nie ma sensu dodawać. I nie używajcie żadnych generatorów precli, piszcie je sensownie ręcznie.
    Znakomity artykuł, dodaje stronę do ulubionych.

  10. bizzit.plon 11 maja 2010 at 19:54

    wszystko ładnie ułożone w jednym miejscu, dzieki za bardzo odbry tekst – dodaję do swoich linków

  11. jkon 24 sie 2010 at 11:23

    Linki na wykopie są nofollow, więc nic nie dają 🙁 na wiki zresztą chyba też. Owszem, mogą zwiększyć ruch na stronie, ale na pozycjonowanie nie mają wpływu…

  12. […] nie mogą one uzyskiwać wysokich rankingów w wynikach wyszukiwania ” – źródło: ittechnology.us), ale trzeba […]

  13. […] Więcej na temat sandboxa można znaleźć tutaj. […]

  14. Matt Delanteon 05 lis 2015 at 22:48

    Sandbox rozumiem, że już specjalnie nie działa? Czy aplikacje pokazujące penality w sandbox mają jakieś znaczenie?