Miło rozpocząć dzień w ten sposób
29 Kwiecień 2009
"Palące dzieci", czyli czego ludzie szukają zaglądając na mój blog
29 Grudzień 2008
Jestem pod wielkim wrażeniem tego co znalazłem w statystykach odwiedzin mojego bloga. Przeglądałem tylko kilka stron spośród wszystkich ponad 32 tysięcy słów kluczowych i wybrałem tylko kilka, by je skomentować. Postanowiłem je podzielić na kilka kategorii, w zależności od tematyki zapytania.
Microsoft
- Windows do ściągnięcia – było wiele kombinacji tego zapytania, np. Windows torrent, Windows XP do ściągnięcia, Windows Vista do ściągnięcia, etc. Moja odpowiedź – nie da się. To nie Ubuntu. Ani nawet Debian. Odpowiedź dla zaawansowanych: MSDN. Z drugiej strony, ciekawi mnie czy Ci, którzy szukali Windowsa do ściągnięcia naprawdę spodziewali się linka do obrazu ISO?
- klucz aktywacyjny do windowsa – tutaj też miałem kilka odmian tego zapytania o cracki, klucze, seriale i temu podobne. To fajnie, że ludzie szukają kluczy na stronach gościa, który pracuje w Microsoft. Bo ostatecznie to chyba dobrze, że tu, a nie gdzie indziej. To szczególnie przydatna informacja, że tego typu zapytania wciąż krążą po Internecie. Oznacza to, że program o nazwie “Anti-Piracy”, którego jestem częścią, ma sens. Następnym razem, po prostu dajcie znać, że macie pirata.
Widziałem jeszcze kilka innych ciekawych dot. produktów Microsoft. Niektóre bardziej, inne mniej śmieszne, ale te dwa wspomniane wyżej zapytania wciąż stanowią największą część słów kluczowych na podstawie których ludzie do mnie trafiają.
Pochodne od IT
- jak działa Google – całkiem dobre wyjaśnienie znajduje się na Wikipedii pod hasłem “Google search“. Niestety nie ma wersji polskiej tego tekstu.
- poszukuję programisty – jeśli tu trafiłeś przez to zapytanie, to źle trafiłeś. Kiedyś szukałem, teraz już nie.
- informatyk wracam do polski z irlandii – czyżby ktoś z polskiego projektu “Powroty” szukał blogerów wśród informatyków szykujących się do powrotu? Zapraszam na stronę forum Polish IT Club, gdzie można poczytać o dyskusjach Polaków pracujących w IT w Irlandii. Kilka wątków o powrotach już się pojawiło.
Totalnie zakręcone
- panie na gg – wróżę krótkie życie agencji matrymonialnych czy ogłoszeń w prasie. Najnowszy przebój to panie na gg!
- jak zostać sławnym/sławną – otwórz bloga, napisz coś i czekaj aż dziwne zapytania będą lądować w Twoich statystykach odwiedzin
- palące dzieci – napisałem kiedyś o cenzurze we Flickr dot. zdjęcia dziecka z papierosem w ustach. Ale mój blog nie jest miejscem do poruszania jakiejkolwiek tematyki związaenej z problemem młodocianych palaczy.
- dlaczego jestem tak naiwny/naiwna? – naprawdę szukasz odpowiedzi na to pytanie? Naprawdę uwierzysz w to, co przeczytasz? To zapraszam tutaj.
- dowal komuś, dowalić komuś, jak dowalić komuś – zadziwiające, że “dowal komus” na Google daje mój blog na pierwszej pozycji wyszukiwania. Live.com już nie popełnia tego błędu.
- dlaczego jestem w jakim celu na świecie – odpowiedzi na to pytanie zazwyczaj poznajesz kiedy jest już za późno by ten cel zrealizować
- dziecko z butelka alkoholu- zdjecia – pochodne do zapytania z papierosem
- księżniczka diana z rodu williams foto galeria – to nawiązanie do mojego posta z października 2007 roku. Ktoś pewnie dostał przypadek podobnego spamu jak ja.
- bedę dobrym sprzedawcą w przyszłości? – nie mam pojęcia. Ale jeśli spodziewasz się znaleźć odpowiedź na to pytanie w Internecie, to jestem przekonany, że nie.
Google, Live czy inne wyszukiwarki zindeksowały każde słowo z mojego bloga. Dlatego nie dziwi mnie, że adres http://michal.osmenda.com pojawia się na liście wyszukiwań, kiedy poszukiwana jest “księżniczka Diana z rodu Williams”. Dziwi mnie jednak, że wchodzą na moją stronę nawet wtedy, kiedy każdy jeden tytuł strony na moim blogu zaczyna się od “ITblog”. IT nie brzmi jak Pudelek czy Onet. IT brzmi całkiem podobnie do information technology, co może oznaczać tematy pochodne do technologii komputerowych.
Czyżby było to wyzwanie dla algorytmów wyszukiwania, by nie umieszczać wysoko na liście stron, które wymieniają wyszukiwaną frazę raz, może dwa razy, ale tematyka jest zupełnie nie przystająca do wyszukiwanych słów?
W jaki sposób możemy zapobiec, by blog taki jak ten był na szczycie wyników wyszukiwania dla frazy “księżniczka diana z rodu williams” pomimo, że moja strona zawiera dokładnie taką frazę, ale tylko raz? A najważniejsze, czy można taką optymalizację zautomatyzować, by zbudować chociaż pozory sztucznej inteligencji odróżniającej główną tematykę (spam, o czym był tekst) od szumu tła (księżniczka, gdzie słowo to wystąpiło dwa razy)?
Proszę nam wybaczyć Zaburzenia wyceniane czasu
22 Wrzesień 2008
Spam dosięga coraz głębszego dna. Oto wiadomość, jaką otrzymałem wczoraj na moją prywatną skrzynkę:
Dear sir/madam:
Please forgive us to disturb your valued time.
This is a big wholesale company in china, sell electronic products to all the world,such as laptop, camera, phone and so on. We can offer the low price and high quality to you. If you have free time, please take a few to visit our official website: <deleted> .
Then any qualm, please contact us freely.
Email: <deleted>
MSn: <deleted>Dear Sir / Madam:
Proszę nam wybaczyć Zaburzenia wyceniane czasu.
Jest to duże firmy hurtowego w Chinach, sprzedaży produktów elektronicznych dla wszystkich na świecie, takich jak laptop, aparat fotograficzny, telefon i tak dalej. Oferujemy niskie ceny i wysoką jakość dla Ciebie. Jeśli masz wolny czas, należy podjąć kilka do odwiedzenia naszej oficjalnej stronie internetowej: <deleted>
Wtedy wszelkie skrupuły, skontaktuj się z nami swobodnie.
E-mail: <deleted>
MSN: <deleted>
Mam wszelkie skrupuły, by nie rozumieć co tu jest do mnie napisane. Po przeczytaniu wersji angielskiej troche mi się w głowie rozjaśniło, ale uśmiech na ustach po przeczytaniu wersji polskiej pozostał. Ciekawe, że po polsku Dear Sir / Madam pisane jest z wielkiej litery, ale w angielskim już nie. Czyżby polski Sir albo Madam musi być grzeczniejsze niż angielskie?
Dało mi też trochę do myślenia. Czy osoby stojące za spamem naprawdę uważają, że ludzie są tak głupi i dadzą się złapać na głupie sztuczki i nie gramatyczny język? Jednak, z czysto statystycznego punktu widzenia, jeśli na taki spam “łapie się” 0.01% odbiorców, to przy 1 mln emaili, daje to 100 osób. Ile zatem musi być takich emaili, by się to opłaciło? 10 mln, 100mln?
Krótkie wakacje zakończone
24 Marzec 2008
Wczoraj wieczorem wróciłem do Dublina, tym samym kończąc moje krótkie, tygodniowe wakacje. To wystarczyło, by naładować baterie pod palmami i na pustyni. Tylko tydzień wystarczył także, by przeżyć szok termiczny związany z aż 25-stopniową różnicą temperatur między Marakeszem a Londynem.
Tak jak podejrzewałem, zużyłem blisko połowę z 30GB dysku, jaki wziąłem na zdjęcia. W sumie zrobiłem 1277 zdjęć, niektóre kopiując kilka razy, tak dla pewności. Pełna galeria znajduje się, jak zwykle, na Flickr.com.
Sprawdziłem jak bardzo ludzie i spamboty za mną tęsknili. Poczta firmowa – 4834 wiadomości (spam: 2), poczta prywatna 269 wiadomości, z czego aż 252 to spam! Dzięki Ci hosting365.ie za 96% spamu! Google Reader powitał mnie 1236 nowymi postami na blogach i serwisach, które subskrybuje. W tym czasie, tydzień 16-23 marca odwiedziło ten blog 2419 osób, z czego aż 84% to nowi użytkownicy.
Czas trochę popracować do następnych wakacji…
40,029 spamu
24 Luty 2008
Można by powiedzieć, że jest co świętować. Akismet pokazał mi dzisiaj, że ochronił mnie przed 40,029 spamowymi komentarzami. Ta prawie okrągła liczba tłumaczy się na:
- 41.26 spamu na post
- 15.77 raza więcej spamowych komentarzy w stosunku do nie-spamowych
- 33.44 spamu na dzień
Panie i Panowie to oficjalne: zalał nas spam.
Fight Spam!-out
24 Styczeń 2008
Poradnik dotyczący metod walki ze spamem musi wylecieć z ITblog. Być może doczeka się nowszej wersji, bo ta się bardzo zdeaktualizowała.
2007, to był dobry rok
22 Styczeń 2008
Długo zwlekałem z podsumowaniami roku 2007. Czekałem aż wybrzmią się gazety, strony, blogi, by z odrobiną dystansu i bez wpadania w utarte schematy napisać jak minął mi ten rok 2007.
Praca. Microsoft.
W 2007 roku, poza codziennymi obowiązkami z zakresu codesign i AV, zacząłem podążać w kierunku narzędzi business intelligence. Jedno z nich, na użytek swojej grupy napisałem nawet sam [1]. Co się kryje pod terminem business intelligence? SQL Server, SQL Reporting Services, Sharepoint Server, Project Server, Project Portfolio Server. Tych dwóch ostatnich produktów Microsoft nie zalicza do grona BI, w ich miejsce wstawiając PerformancePoint Server, ja jednak wykazuje inicjatywę we własnej terminologii. W celu optymalizacji procesów i zarządzania projektami zaproponowałem kilka rozwiązań wykorzystujących BI. Z tego wszystkiego stałem się menedżerem projektu i tak już zostało.
Pod koniec roku zakupiłem sobie książkę Davida Allena Getting Things Done. Bardzo pożyteczna lektura!
Ucierpiały moje wakacje. W zeszłym roku nie byłem zbyt często na urlopie, dlatego na 2008 przeniosło mi się 12 niewykorzystanych dni. W sumie 37 do wykorzystania!
Blog. ITblog.
Po miesiącach walki z Servage [2] zmieniłem hosting na irlandzką firmę hosting365.ie. Moja strona jest teraz dostępna, a przynajmniej od momentu przenosin była dostępna, przez 100% czasu. Nie mam problemów z konfiguracją, nie kontaktowałem się jeszcze ani razu z pomocą techniczną. Niestety, nowy hosting ma problem ze spamem. Jest go zdecydowanie za dużo a ochrony żadnej brak [3].
Mam więcej czytelników, co mnie bardzo cieszy i bardzo motywuje do dalszej pracy. Ze statystyk z Feedburner’a wynika, że 2007 był rekordowo dobrym rokiem pod względem czytelnictwa.

Google Analytics też potwierdza te trendy, choć już nie tak wyraźne. Wnioskuję, że większość internautów woli czytać bloga przez RSS niż zaglądając na stronę. Analytics pokazał mi, że różnice rok do roku czasami były dość dramatyczne:

Rok do roku zanotowałem wzrost odwiedzin o ponad 72%, 75% na page views, bounce rate spadł o ponad 3% co też jest pocieszające, długość czasu spędzonego na stronie wzrosła o ponad 11%. Miałem natomiast o 4% mniej nowych wizyt niż w roku 2006. Przy jednoczesnym wzroście w odwiedzalności oznaczać to może, że mam stałych czytelników. Dziękuję, wpadajcie częściej!
Bardzo duży bo prawie 185% wzrost zaobserwowałem przy ruchu przychodzącym z Wielkiej Brytanii. Na drugim miejscu, ze 146% uplasowała się Irlandia i 125% – Stany Zjednoczone. Innymi statystykami już nie będę zanudzał. Wszystkie te dane pochodzą z Google Analytics, gdzie jest dostępna opcja porównywania zebranych danych. Naprawdę dobre narzędzie!
A co w 2008 roku? Premiera Windows Server 2008, Windows Vista SP1, Windows XP SP3 i kilku innych produktów, których nie pamiętam bądź wymieniać nie mogę
W niedługim czasie postaram się opublikować kilka materiałów wideo prezentujących kilka narzędzi z zakresu business intelligence. Natomiast w drugiej połowie roku skupię się na mojej pracy na uczelni i projekcie sieci rozproszonej. DIT pomoże mi nawiązać kontakt z IBM i Google, które wspólnie tworzą uczelniany grid.
Życzę Dobrego Roku 2008!
