Jeden z pracowników serwisu Flickr opublikował wczoraj na swoim twiterrze notkę o następującej treści:

We ate 10 fuckin terabytes yesterday in uploads. Not bad.

10 TB danych w ciągu zaledwie jednego dnia! To oznacza około 121MB na sekundę, 7GB co minutę. Naprawdę chciałbym poznać ich infrastrukturę.

Jestem pod wielkim wrażeniem tego co znalazłem w statystykach odwiedzin mojego bloga. Przeglądałem tylko kilka stron spośród wszystkich ponad 32 tysięcy słów kluczowych i wybrałem tylko kilka, by je skomentować. Postanowiłem je podzielić na kilka kategorii, w zależności od tematyki zapytania.

Microsoft

  • Windows do ściągnięcia – było wiele kombinacji tego zapytania, np. Windows torrent, Windows XP do ściągnięcia, Windows Vista do ściągnięcia, etc. Moja odpowiedź – nie da się. To nie Ubuntu. Ani nawet Debian. Odpowiedź dla zaawansowanych: MSDN. Z drugiej strony, ciekawi mnie czy Ci, którzy szukali Windowsa do ściągnięcia naprawdę spodziewali się linka do obrazu ISO?
  • klucz aktywacyjny do windowsa – tutaj też miałem kilka odmian tego zapytania o cracki, klucze, seriale i temu podobne. To fajnie, że ludzie szukają kluczy na stronach gościa, który pracuje w Microsoft. Bo ostatecznie to chyba dobrze, że tu, a nie gdzie indziej. To szczególnie przydatna informacja, że tego typu zapytania wciąż krążą po Internecie. Oznacza to, że program o nazwie “Anti-Piracy”, którego jestem częścią, ma sens. Następnym razem, po prostu dajcie znać, że macie pirata.

Widziałem jeszcze kilka innych ciekawych dot. produktów Microsoft. Niektóre bardziej, inne mniej śmieszne, ale te dwa wspomniane wyżej zapytania wciąż stanowią największą część słów kluczowych na podstawie których ludzie do mnie trafiają.

Pochodne od IT

  • jak działa Google – całkiem dobre wyjaśnienie znajduje się na Wikipedii pod hasłem “Google search“. Niestety nie ma wersji polskiej tego tekstu.
  • poszukuję programisty – jeśli tu trafiłeś przez to zapytanie, to źle trafiłeś. Kiedyś szukałem, teraz już nie.
  • informatyk wracam do polski z irlandii – czyżby ktoś z polskiego projektu “Powroty” szukał blogerów wśród informatyków szykujących się do powrotu? Zapraszam na stronę forum Polish IT Club, gdzie można poczytać o dyskusjach Polaków pracujących w IT w Irlandii. Kilka wątków o powrotach już się pojawiło.

Totalnie zakręcone

  • panie na gg – wróżę krótkie życie agencji matrymonialnych czy ogłoszeń w prasie. Najnowszy przebój to panie na gg!
  • jak zostać sławnym/sławną – otwórz bloga, napisz coś i czekaj aż dziwne zapytania będą lądować w Twoich statystykach odwiedzin
  • palące dzieci – napisałem kiedyś o cenzurze we Flickr dot. zdjęcia dziecka z papierosem w ustach. Ale mój blog nie jest miejscem do poruszania jakiejkolwiek tematyki związaenej z problemem młodocianych palaczy.
  • dlaczego jestem tak naiwny/naiwna? – naprawdę szukasz odpowiedzi na to pytanie? Naprawdę uwierzysz w to, co przeczytasz? To zapraszam tutaj.
  • dowal komuś, dowalić komuś, jak dowalić komuś – zadziwiające, że “dowal komus” na Google daje mój blog na pierwszej pozycji wyszukiwania. Live.com już nie popełnia tego błędu.
  • dlaczego jestem w jakim celu na świecie – odpowiedzi na to pytanie zazwyczaj poznajesz kiedy jest już za późno by ten cel zrealizować
  • dziecko z butelka alkoholu- zdjecia – pochodne do zapytania z papierosem
  • księżniczka diana z rodu williams foto galeria – to nawiązanie do mojego posta z października 2007 roku. Ktoś pewnie dostał przypadek podobnego spamu jak ja.
  • bedę dobrym sprzedawcą w przyszłości? – nie mam pojęcia. Ale jeśli spodziewasz się znaleźć odpowiedź na to pytanie w Internecie, to jestem przekonany, że nie.

Google, Live czy inne wyszukiwarki zindeksowały każde słowo z mojego bloga. Dlatego nie dziwi mnie, że adres http://michal.osmenda.com pojawia się na liście wyszukiwań, kiedy poszukiwana jest “księżniczka Diana z rodu Williams”. Dziwi mnie jednak, że wchodzą na moją stronę nawet wtedy, kiedy każdy jeden tytuł strony na moim blogu zaczyna się od “ITblog”. IT nie brzmi jak Pudelek czy Onet. IT brzmi całkiem podobnie do information technology, co może oznaczać tematy pochodne do technologii komputerowych.

Czyżby było to wyzwanie dla algorytmów wyszukiwania, by nie umieszczać wysoko na liście stron, które wymieniają wyszukiwaną frazę raz, może dwa razy, ale tematyka jest zupełnie nie przystająca do wyszukiwanych słów?

W jaki sposób możemy zapobiec, by blog taki jak ten był na szczycie wyników wyszukiwania dla frazy “księżniczka diana z rodu williams” pomimo, że moja strona zawiera dokładnie taką frazę, ale tylko raz? A najważniejsze, czy można taką optymalizację zautomatyzować, by zbudować chociaż pozory sztucznej inteligencji odróżniającej główną tematykę (spam, o czym był tekst) od szumu tła (księżniczka, gdzie słowo to wystąpiło dwa razy)?

Nadrabiam zaległości i przeglądam filmy nakręcone na PDC. W ręcę wpadły mi ciekawe statystyki dot. korzystania z funkcjonalności interfejsu użytkownika systemu Windows.

Dla przykładu, cytując informacje z jednej sesji (PC24 Windows 7: Welcome to the Windows 7 Desktop)

  • <= 14 – maksymalna liczba jednocześnie otwartych okien dla większości sesji (0-90%)
  • 0.21% użytkowników korzysta z paska zadań po prawej stronie ekranu, a 98% trzyma go domyślnie na dole ekranu
  • 4.97% użytkowników korzysta z opcji auto ukrywania paska zadań
  • 90.4% użytkowników korzysta z grupowania aplikacji na pasku zadań
  • 95% ma wyświetlone menu szybkiego uruchamiania

Dane te zostały zebrane od użytkowników, którzy dobrowolnie wysyłali anonimowe statystyki w jaki sposób używali systemu. W pracach nad UI dla Windows 7 dane te zostały wykorzystane, by udoskonalić sposób w jaki korzystamy z systemu.

A w środę czytam blogi…

29 Grudzień 2008

Odkryłem zadziwiającą prawidłowość w regularności czytania przeze mnie blogów. A co jeszcze ciekawsze, podobna prawidłowość dotyczy także regularności ukazywania się nowych postów na blogach, które subskrybuje.

O co chodzi? Już śpieszę donieść.

Największą aktywność autorzy blogów wykazują we wtorek i środę, a ja zdaję się podążać tym tropem spędzając najwięcej czasu w środę na ich lekturę. Czemu akurat wtorek i środa?

Jeśli ktoś zobaczyłby mnie co robię pomiędzy 7 a 10 nad ranem, z dużą dozą prawdopodobieństwa czytałbym blogi. To czas, kiedy jeszcze nic się w biurze nie dzieje, nie ma spotkań, jest za to czas na śniadanie i poranną lekturę. Do obowiązkowej prasówki, w której skład wchodzi lektura BBC News, CNN, Wyborcza.pl i Irish Times, dołożyłem lekturę tego co piszą blogerzy.

Czasami ciekawe posty oznaczam gwiazdką, inne współdzielę, co widać na blogu. Aby zobaczyć całą listę postów, którymi się z Wami podzieliłem, zapraszam pod >ten< link.

Filmik z YouTube co to jest Google Reader Trends:

Standards, stupid!

27 Grudzień 2008

To jest forum na Microsoft Technet dotyczące MOF – Microsoft Operation Framework. Ta strona to doskonała kopalnia wiedzy i doświadczeń innych osób w temacie MOF, szczególnie przydatne dla menedżerów IT i wszystkich zainteresowanych usprawnianiem zarządzania w IT.

Szkoda tylko, że ta sama strona na Firefox wygląda zgoła inaczej:

To dość męczące, jeśli nawet nie wkurzające by wiedzieć tę samą stronę dwojako w dwóch przeglądarkach.

Standards, stupid!

Podobno pracownicy MS to najwięksi krytycy firmy. Dołączam się zatem do krytyki.

Wesołych Świąt!

24 Grudzień 2008

Chciałbym w tym szczególnym dniu życzyć wszystkim Wesołych Świąt, spędzonych z bliskimi przy stole ze smakołykami i obok choinki z prezentami.

Ja, jak co roku spędzam święta w rodzinnej miejscowości w Polsce.

You are using WordPress 2.7

13 Grudzień 2008

Blog zaktualizowany do WordPress 2.7.

Strona administracyjna wersji 2.7

Strona administracyjna wersji 2.7

Zmiany dotyczą tylko strony administracyjnej silnika bloga i muszę przyznać, że są to zmiany na lepsze.

Nowa wersja do pobrania jak zwykle z http://wordpress.org

FolderShare to była taka fajna i mała aplikacyjka, która służyła do wymiany plików między komputerami. O tyle przydatne narzędzie, że pozwalało np. na przeglądanie zasobów zdalnych komputerów, które miałem w synchronizacji.

FoldeShare zdobył sobie nawet uznanie mojej promotorki na DIT, która korzystała z niego by dzielić się ze mną plikami, a ja bym podrzucał jej kolejne wersje mojej pracy dyplomowej.

Niedługo jednak dane było mi się cieszyć z FolderShare, ponieważ został zastąpiony przez Windows Live Sync. Nowa wersja aplikacji przeszła kilka zmian kosmetycznych i niewiele poza tym. Wciąż działa równie dobrze.

Jedynym mankamentem po instalacji jest to, że wszystkie nasze współdzielone pliki trzeba ponownie skonfigurować w programie. Dotyczy to zarówno plików, które dzielę miedzy swoimi komputerami (3 maszyny na dzień dzisiejszy) jak i pliki, które współdzielę z innymi osobami.

Windows Live Sync jest dostępny na Windows (XP, Vista, nie testowane jeszcze pod Windows 7) oraz na MacOS. Do ściągnięcia za darmo z Live.com.

Z serii przydatnych, a.k.a. warto wiedzieć, a.k.a. “zapiszę tutaj, to nie zapomnę”. W wyszukiwarkach ten post powinien być także znaleziony poprzez “jak zachować połączenia ODBC”, “jak zrobić kopię połączeń ODBC” albo “jak zrobić backup ODBC”.

  1. regedit
  2. HKLM -> Software -> ODBC
  3. prawy klik na ODBC.INI
  4. …i po robocie

Szybkie i szalenie przydatne, zwłaszcza przy robieniu kopii serwerów.

Tak wyglądała dzisiaj rano strona www.microsoft.ie:

No cóż, zdarza się nawet najlepszym :)