Potenciál súčasných vyhľadávačov a trhy
V súčasnosti majú veľkú hodnotu rôzne firmy, ktoré pracujú v oblasti zberu, výberu a analýz informácií. Okrem základných vyhľadávačov ako sú Google, Yahoo, či Bing existujú aj alternatívne vyhľadávača, ktoré sú určené na špecifické účely – vyhľadávanie zhlukov slov, obrázkov a podobne. Súčasný gigant v oblasti elektronického vyhľadávania Google od svojho vzniku (1990 stále rastie, ale je známe, že jeho podiel začína mierne klesať pod tlakom konkurentov, ktoré si tiež získavajú nové technológie a stúpa ich popularita.
Medzi hlavných konkurentov Google patrí firma Apple a jej operačný systém (iOS), ktorý je oveľa populárnejší ako Android, ktorý momentálne patrí Google, rastúce sociálne siete (predovšetkým Facebook) ako spoľahlivejší zdroj exkluzívnej informácie, vyhľadávače Yahoo, Baidu a Microsoft Bing, ktoré z hľadiska efektívnosti neustupujú Google. Treba pripomenúť, že jeden zo zamestnancov Microsoft – podľa jeho tvrdenia absolútne nezištne – stránku BlindSearch, ktorá spracováva dopyt pre tri vyhľadávače (Bing, Google a Yahoo) súčasne. Výsledky sú zobrazené v troch stĺpcoch, pričom nevidieť ktorý stĺpec má vzťah k akému vyhľadávaču. Používateľ stránky by mal hlasovať za stĺpec, ktorý má podľa jeho názoru najlepší obsah. Až potom sa objaví aký to bol vyhľadávač. Okrem Google a jeho konkurentov v sektore stredného prúdu je v sieti masa takzvaných „alternatívnych“ vyhľadávačov, ktorých počet neustále rastie. Medzi nimi sú komerčné, amatérske ale aj výskumné projekty. Každý vyhľadávač sa špecializuje na rozpracovaní určitého princípu.
Niche search engines V angličite sa špecializovaným vyhľadávačom hovorí “niche search engines”. Je to najrozšírenejši typ vyhľadávačov. Ich úlohou je to, aby vyhľadávali odkazy z určitej oblasti, tematiky, napríklad len obrázky (napríklad www.picsearch.com), audio (www.poiskm.ru) alebo video (http://www.blinkx.com). Vyhľadávanie textov: do riadku sa vkladajú kľúčové slová a systém poskytne viac, či menej relevantných odpovedí. Existuje vyhľadávač na anglicky písané blogy: www.technorati.com, vwww.filestube.com a www.downloadanystuff.com hľadajú všetko, čo sa
stiahnuť; www.scirus.com hľadá v internete materiály vedeckej tematiky, Internet Archive(www.archive.org), ktorý sa objsavil v roku 1996 používa servis WayBack, ktorý umožňuje pozerať ako vyzerala tá, ktorá stránka v minulosti, dokonca keď už neexistuje. Existujú vyhľadávače exotického typu, napríklad www.findsounds.com sa špecializuje na zvukoch (chrápanie, bučanie kravy, škrípanie dverí a mnohé iné zvuky); vyhľadáva na základe kľúčových slov v angličtine, francúzštine, nemčine a španielčine). V neposlednom rade sa stretávajú aj zariadenia, ktoré napríklad vyhľadávajú to, ktorý z najbližších obchodov je otvorený (www.whatsopen.com), hľadajú citáty, alebo okrídlené slová, www.quotiki.com a recepty jedál (www.cookstr.com).
Klasifikujúce vyhľadávače
Vyhľadávače založené na systéme vychádzajúce z pojmu Cluster sa objavili v polovici tohto desaťročia. Sú to vyhľadávače, ktoré poskytujú výsledky tak, že ich zoskupujú. Tento systém sa objavil napríklad v Rusku – www.nigma.ru. Poskytuje odpovede tak, že vložíte jedno slovo a poskytuje zoznam tematických skupín. Ak si vyberiete jednu skupinu, objaví sa rad podskupín, ktoré si môžete vybrať. Týmto spôsobom môžete spresniť súbor odkazov, ktoré zodpovedajú zadaniu. Súčasne vyhľadáva v svojom systéme, ale aj pomocou veľkých vyhľadávačov. O niečo skôr sa objavil anglický vyhľadávač www.clusty.com, ktorý sa neskôr premenoval na http://search.yippy.com/. Kedysi sa o ňom napísalo ako vážnom konkurente Google, pretože usporiadanie strán vďaka ktorému sa Google stal vyhľadávacím gigantom, ktorý umožňuje vyraďovanie neinformatívnych reklamných stránok, a súčasne clusterizácia predpokladá intelektuálne spracovanie materiálu a jeho usporiadanie do tematického prehľadu.
Multimediálne vyhľadávače
Pred rokom firma Google uskutočnila výskum, aby zistila čo chcú používatelia moderných vyhľadávačov. Ako sa dalo očakávať, väčšina želaní sa redukovala na to, aby systém čítal myšlienky užívateľa rozpoznával ľudský hlas, rozpoznával náladu užívateľa, hovoril ľudským jazykom, chránila deti pred zlom a podobne. Všetko sa nedá dosiahnuť naraz, preto
vývojoví pracovníci idú rôznymi cestami.
3D
Jeden zo smerov je priamo spojený s rozšírením multimediálnych možností moderných osobných počítačov. Na jednej strane v sieti je čoraz viac súborov so zvukovým a obrazovým
obsahom. Na druhej strane moderné osobné počítače majú také parametre, ktoré umožňujú sťahovanie objemovo veľkých súborov s animáciami a 3D. V súvislosti s tým sa začali vyvíjať vyhľadávače pre 3D. Zatiaľ sú veľmi ťažkopádne a neprinášajú žiadnu zábavu. Napríklad taký je projekt, ktorý bol spustený v roku 2008 www.exitreality.com. ExitReality – je to browser plugin, ktorý ukazuje akýkoľvek server vo formáte 3D, ináč povedané vo forme priestoru, v ktorom sa dá premiestňovať vo forme avataru alebo bez neho, klikať na odkazy, prezerať si video alebo obrázky. Ako vyhľadávač sa ExitReality špecializuje na vyhľadávaní 3D-obsahu, napríklad ak do neho vložíme slovo Paris, získame odkazy na 3D-simulátory okolia Víťazného oblúka námestia
Étoile, cez ktoré sa dá opäť chodiť v podobe avatara. Prečo je to potrebné, nie je úplne jasné, kvôli veľkosti výpočtov spomaľujú chod dokonca veľmi rýchle osobné počítače a preto nie je tento systém medzi užívateľmi populárny. Tí, ktorí potrebujú chatovať s Víťazným oblúkom námestia Étoile, alebo londýnskou ulicou Abbey Road, pravdepodobne bývajú v sieti http://secondlife.com/, ktorého princíp sa snažil projekt ExitReality snažil využiť pre prácu v internete.
Bez ohľadu na to, pokračuje sa v používaní 3D prvkov v internetových stránok pri ich tvorbe. Tieto systémy sa stávajú známe vďaka svojej vonkajšej podobe a forme, ktorej poskytujú údaje. Systém http://search.spacetime.com/ je skôr inteface vyhľadávača. Výsledky získava z najväčších vyhľadávacích systémov a získavajú sa vo forme screenhot jednotlivých stránok v rôznej miere vzdialenosti od užívateľa. Neexistuje klasifikácia stránok, ich relevancia je relatívna, rýchlosť je veľmi pomalá. Jediná prednosť systému je nezvyčajná vonkajšia podoba, v skutočnosti je to zvláštny typ 3D. Ešte jeden príklad – vyhľadávač obrázkov a videa (na základe výsledkov Google) http://search-cube.com/. Poskytuje výsledky v podobe obrázkov, nalepených na hranách kocky, ktorá sa á obracať na všetky strany a vyberať si tie, ktoré sa vám zapáčia. Systém pracuje pomaly a skôr je určený na zábavu.
Netextové vyhľadávanie
Tieto vyhľadávače majú úplne inú podstatu. Ich konštruktéri sa snažia vytvoriť systémy, ktoré by nehľadali podľa slov. Textový vyhľadávač, pri nespochybniteľných výhodách, majú vážne
obmedzenia. Keď treba hudobné dielo určiť a nájsť podľa melódie a iné informácie neexistujú, textové vyhľadávanie vám nepomôže. V tomto prípade treba využívať spoločenstvo sociálnych sietí, čo nie je vždy efektívne. Ako medzistupeň sa vytvárajú špeciálne spoločenstvá, http://www.midomi.com/ kde sa dá naspievať /nahrať / umiestniť / melódia kvôli tomu, aby ju iní členovia spoločenstva identifikovali. V tomto zmysle najprogresívnejšie riešenie navrhol projekt Musipedia. Ide o hudobnú encyklopédiu, ktorá sa podobá na Wikipédiu. Tento vyhľadávač pomáha spracovať požiadavku niekoľkými spôsobmi – nahrať hudobný fragment v notách, na piano, naspievať a vyťukať rytmus klávesmi. To sa dá doplniť textovým sprievodom. Musipedia využíva vlastnú databázu údajov, ktoré napĺňajú používatelia a tiež hľadá súbory typu MIDI. Efektívnosť vyhľadávania je relatívna.
Vyhľadávače zamerané na zobrazenia majú podobné ciele. Okrem textového vyhľadávača, navrhujú užívateľovi vkladať do systému vlastné obrázky a vyhľadá tie, ktoré sa podobajú na
jeho. Predpokladá sa, že týmto spôsobom sa mu pomôže určiť čo je na obrázku. Vyhľadávanie sa uskutočňuje podobne ako v prípade s textom. Hľadajú sa kľúčové prvky – kompozícia, forma, farba. Ako príklad sa dajú uviesť také systémy ako http://tinyeye.com/, alebo relatívne slabý vyhľadávač http://sapir.isti.cnr.it/ skonštruovaný firmou IBM. Niektorí konštruktéri venujú
zvláštnu pozornosť vyhľadávaniu fragmentov videa, ktoré je už umiestnené v sieti. Celá záležitosť sa komplikuje tým, že v relatívne krátkom čase treba spracovať relatívne veľký
počet súborov. Tieto vyhľadávače zatiaľ nie sú, ale existuje niekoľko projektov. V roku 2009 sa objavilo niekoľko článkov o štarte inovačného projektu DIVAS (http://www.ict-diva.eu/),
ktorý využíva na identifikáciu video podľa parametrov, ktoré sa nazývajú „digitálne odtlačky prstov“ ftp://ftp.cordis.europa.eu/pub/ist/docs/ka4/au_fp6_divas_en.pdf. Stránka s beta
verziou dnes už neexistuje. Projekt s veľkým rozpočtom vznikal v rámci programu Európskej únie CORDIS. Európska komisia má na svojej stránke veľa projektov, ktoré sa zaoberajú
projektmi vyhľadávania multimediálneho obsahu.
Ľudský hlas
Ako ukázali údaje výskumu Google, užívatelia pociťujú potrebu v hlasovej komunikácii s vyhľadávačmi. V sieti prakticky nie sú vyhľadávače, ktorý by reagovali na ľudský hlas. V podstate túto možnosť predpokladá experimentálny vyhľadávač Voccal (http://www.vocalcom.com/). Aby ste s ním začali ústne komunikovať v angličtine, musíte si nastaviť osobný počítač a dešifrovanie rečového prejavu. Oveľa vážnejšie pokusy robí Google, ktorý otvoril beta verziu programu, ktorý umožňuje americkým užívateľom (http://www.google.com/goog411/index.html) spojenie s vyhľadávačom prostredníctvom mobilného telefónu.
Vyhľadávač ešte nerozpoznáva ľudskú reč a nereaguje na kľúčové slová. V ideálnom prípad by mal systém rozprávať s užívateľom a dávať mu doplňujúce otázky. Týmto sa zaujímajú konštruktéri mnohých „intelektuálnych“ vyhľadávačov, ktorí sa snažia naučiť stroj tomu, aby zohľadňoval ľudský faktor.
Medzi podobné projekty patrí celá kategória systémov, ktoré sa špecializujú na rozhovore s užívateľom. V angličtine ide o systémy označované pojmom natural language search engines. Jedným z prvých pokusov bol systém Ask.com, ktorý môže na jednej strane vyhľadávať podľa kľúčových slov s tematickým zoskupením výsledkov, ale na druhej strane sa pýta na obyčajné otázky. Napríklad www.ask.com zisťuje koľko je hodín. Užívateľa môže požiadať o spresnenie kde sa užívateľ nachádza.
Vyhľadávač www.lexxe.com tiež reaguje na niektoré otázky. Ak sa ho na niečo opýtate, samozrejme v anglickom jazyku, najprv poskytne krátku odpoveď – áno/nie/stručnú
informáciu. Niektoré odpovede nie sú vôbec správne. Zábavný vyhľadávač vytvorený v MTI http://start.csail.mit.edu/, sa skôr podobá na virtuálneho diskutéra, ale ja naladený na informačné orientované otázky. Odpovedá na otázku a nedáva rozsiahle odpovede, ale skôr odkazuje na články vo Wikipédii.
Vyhľadávač Poverset www.poverset.com vyhľadáva (v angličtine) algoritmus sémantického vyhľadávania. Používa širokospektrálne nástroje, ktoré navigačné prispôsobenia pre
vypáčenie informácií z Wikipédie.
Celkom zaujímavý vyhľadávač je Omnipelagos, ktorý je vytvorený kvôli zábave. Systém www.omnipelagos.com vytváral spojenia medzi dvomi pojmami – napríklad medzi vranou
a písacím stolom. Relatívne nedávno odštartoval systém Yebol (www.yebol.com). Popri vyhľadávači Powerset a Hakia, tento systém vyhľadáva algoritmus sémantického vyhľadávania, ktorý predpokladá interpretáciu otázky a riešenie komplikovanejších úloh. Google vyhľadáva len na základe kľúčových slov.
Yebol má pohodlný interface a berie do úvahy Twitter, spravodajské materiály, diskusné fóra a podobne. Jeho výsledky sa výrazne neodlišujú od Google, ale niekedy prinášajú zaujímavé
výsledky