Latentti semanttinen indeksointi Googlen algoritmissä
Google update Allegra on tapahtunut 2.2.2005. Uudessa indeksissä näyttää olevan enemmän ja enemmän latenttia semantiikkaa. Googlen hakualgoritmiä on kehitelty piilevään semanttiseen suuntaan jo viime keväästä saakka. Kysymys on puhtaasta matemaattisesta lineaarialgebraan perustuvasta menetelmästä, jossa ei yritetäkään ymmärtää sanojen merkityksellistä sisältöä, vaan hakusanan synonyymien esiintymistiheyksiä dokumenteissä. Enää ei kaikissa tapauksissa tarvitse laittaa tildeä (~) hakutermin eteen saadakseen semanttisen hakuvastauksen.
Googlen haku voi palauttaa kärkeen viitteitä dokumenttiin, joilla ei edes mainita hakufraasia. Osittain tämä johtuu linkkien ankkuriteksteistä, mutta englanninkielisissä hauissa latenttisella semanttisella indeksoinnilla on vahva vaikutus.
Vertailu LSI:n vaikutuksista Googlen hakutulokseen (linkit avautuvat uuteen ikkunaan):
Googlen haku ~soda palauttaa Pepsin ja Cociksen kärkeen.
Googlen haku soda antaa ihan eri tuloksen.
Vaikutusta voi olla myös haussa tarja halonen jossa Tasavallan Presidentin kotisivut tulevat ykköseksi ilman, että sivulla on muuta sisältöä kuin tyhjä frame setti.
Google ei vielä tietääkseni indeksoi suomenkielisten sanojen synonyymejä.
Googlen haku voi palauttaa kärkeen viitteitä dokumenttiin, joilla ei edes mainita hakufraasia. Osittain tämä johtuu linkkien ankkuriteksteistä, mutta englanninkielisissä hauissa latenttisella semanttisella indeksoinnilla on vahva vaikutus.
Vertailu LSI:n vaikutuksista Googlen hakutulokseen (linkit avautuvat uuteen ikkunaan):
Googlen haku ~soda palauttaa Pepsin ja Cociksen kärkeen.
Googlen haku soda antaa ihan eri tuloksen.
Vaikutusta voi olla myös haussa tarja halonen jossa Tasavallan Presidentin kotisivut tulevat ykköseksi ilman, että sivulla on muuta sisältöä kuin tyhjä frame setti.
Google ei vielä tietääkseni indeksoi suomenkielisten sanojen synonyymejä.




0 Comments:
Lähetä kommentti
<< Home