Tietoviikon sivuilta muistaakseni luin vinkin Yacyyn, joka vaikutti kiintoisalta hakukoneelta, tai niin kuin lehti kertoili, Googlen korvaajalta.
Hmm, nyt tuossa on iloisesti mielestäni sotkettu kaksi asiaa.
1) Indeksointi
2) (Globaali) Hakupalvelu
-- Asiaan --
1) YaCy taitaa soveltua mainosti rajatuun indeksointiin ja siihen liittyvään hakuun. Joka voidaan myös toteuttaa monella full text tietokannalla ja yksinkertaisella dataa syöttävällä scriptillä tiettyyn rajaan asti.
Tämä on mielestäni varsin selkeää.
2) Tämä ei taas onnistu käsittääkseni mitenkään järkevästi YaCyllä, olen joskus vuosia sitten aiheesta lukenut aja ainakaan silloin tuossa ei ollut mitään erittäin edistynyttä ja fiksua sharding menetelmään jolla halutut tulokset saavutettaisiin tehokkaasti. -> Homma toimii hitaasti ja huonosti, lisäksi tulosten ranking voi olla ihan mitä sattuu.
Kohta yksi onkin helposti ratkaistavissa, useillakin vaihtoehdoilla. Kohta kaksi onkin se joka on sitten erittäin vaikea. Varsinkin jos siis halutaan varmistaa isossa hajautetussa verkossa suorituskyky, sekä pitää mukana esim. suurta määrää peerejä, joilla on erittäin rajalliset indeksointitulokset. Ongelmaksi muodostuu silloin ns. super-nodejen puute, jolla olisi riittävän kattava datasetti, vaikka se ei kata kaikkea, se tietäisi mistä tietoa löytyy lisää kun sitä tarvitaan.
Koska käsittäkseni nykyisessä ratkaisussa tuota supernode ratkaisua ei ole, se johtaa siihen, että palvelu on enemmän tai vähemmän käyttökelvoton. Ehkäpä tuota voisi ajaa joku riippumaton organisaatio lahjoituksilla tms. Eli olisi oikea YaCy "hakupalvelu", eikä vain epämääräistä joukkoa YaCy nodeja, joiden tuloksista ei saada oikein mitään varmuutta.
Tietysti joku joka on nyt tuohon asiaan perehtynyt paremmin kuin minä, voisi kertoa miten asiat oikeasti on. Tällaisen käsityksen asiasta sain vaan yhden viikonlopun leikkimisellä ja asian tutkimisella pari kolme vuotta sitten. Missään nimessä YaCyllä ja joukolla [Google, Bing, DuckDuckGo, Yandex, Baidu, Soso] ei ole sinänsä mitään yhteistä, koska periaate on ihan erilainen.
LopputulosYaCyn suhteen pitäisi tehdä mielestäni paljon työtä hajautuksen toiminnallisuuden tehostamiseen ja supernodeihin, jotta siitä saataisiin jotain järkevää ulos suuremmassa mittakaavassa. Paras tapa olisi mielesäni jonkinlainen non-profit organisaatio, joka pyörii kohtuullisin lahjoituksin.
Edit: Otsikon case korjattu.