Root.czBlogyMartin Hassman: nejen o prohlížečích

Slova, slova, slova nejen v mraku dánském

Martin Hassman, 16. 12. 2008, 15:00 v kategorii Ostatní, štítky:

Wordle je takový roztomilý projekt, jenž vám ze sady slov, která mu zadáte, nebo která najde na odkázaném webu, sestaví tag cloud, abyste poznali, o čem to vlastně píšete.

Co to čtete princi?

Pustil jsem ho i na Zdroják a výsledek není vůbec mimo:

Wordle pro Zdrojak

Řadu další vygenerovaných obrázků najdete na Google nebo si můžete vygenerovat vlastní.

Komentáře (10)

  1. 16. 12. 2008, 17:02 Franta napsal:

    Vizuálně pěkné, ale když jsem to pustil na pár českých stránek, vracelo to náhodné shluky slov, i těch bezvýznamných, které jsou v každém textu, nejen klíčových.

    A taky škoda tohohle:

    "May I see the source code?"
    "Unfortunately, no."

  2. 16. 12. 2008, 18:51 danaketh napsal:

    Zajímavé :)

    [1] K čemu koukat do zdrojáku?

  3. 16. 12. 2008, 21:57 zxcvzxcvzxcv napsal:

    "May I see the source code?"
    "Unfortunately, no."

    jak to asi bude fungovat?! najde se vyskyt nejcastejsich slov.
    frekvence vyskytu slova odpovida jeho velikost v mraku.
    se sadou vybranych slov a s velikosti jejich textboxu se zacnou skladat textboxy,
    tak aby vyplnila co nejmensi plocha.
    to uz je trimming problem, optimalizace skladani ruzne velkych zlatych cihel do batohu,
    na to jsou zname ruzne algoritmy.

  4. 17. 12. 2008, 00:06 Tom napsal:

    Může být ten výsledek i klikací?

  5. 17. 12. 2008, 07:23 Pavel Troller napsal:

    Ehm.. Taky bych rekl, ze vyber slov do cloudu by to chtelo trosku zlepsit, napriklad z toho zde uvedeneho vypustit nic nerikajici slova jako "kazdy", "dalsi", "Dnes", "krokem" a "zde". Taktez se mi jevi, ze nektera slova jsou tam jaksi navic, ikdyz nejsou moc bezna, treba me udivuje "Wolfenstein" - sice nemam Zdrojak precteny od A do Z, ale ze by se mu nejak venoval, o tom pochybuji :-).

  6. 17. 12. 2008, 09:56 shmoula napsal:

    kdyby se daly definovat stop-slova, bylo by to imho o neco lepsi...

  7. 17. 12. 2008, 10:02 Martin Hassman napsal:

    [5] Zrovna teď věnoval. Velikost jeho zobrazení odpovídá jednomu nalezenému výskytu. Při vygenerování o pár týdnů později by tam už nebyl a místo něj by se objevilo něco jiného. Prostý šum.

  8. 17. 12. 2008, 11:11 Franta napsal:

    [2] spíš si to nainstalovat u sebe a použít v nějakém svém projektu – ale vzhledem ke kvalitě výstupu, by asi stejně bylo lepší si to napsat po svém a přizpůsobit češtině.

    [5] to asi souvisí s těmi 3D HTML hrami.

  9. 17. 12. 2008, 16:40 klokánek napsal:

    [6] no on tam ten seznam stop-slov je, akorát není úplně přizpůsobenej na češtinu. s angličtinou funguje mnohem líp. možná kdyby si někdo dal tu práci a autorovi poslal českej, třeba by ho tam zadělal.

  10. 18. 12. 2008, 10:01 shmoula napsal:

    [9] on by spis autor mohl vydat zdrojaky a neohanet se IBM ;-)

K tomuto spotu není povoleno přidávání komentářů.