Flood pe google, hosted by Starnet

si tu crezi ca mie in genere era fun sa scriu tot asta? nu chiar ca nu e nimic de argumentat aici, doar ca daca am spus ca scriu deamu trebuia sa scriu
 
da-mi si mie un link unde ai citit despre hashing.
maximum ce ei pot sa faca e hashing la cuvinte, dar asta mare performantza nu poate da.
 
omg!!!!!!!!!!!!!!!!!!!!!!!!!!!!
ei sunt vestitzi pentru asta! cred ca vreo 3 profi a mei au dat ca exemplu ce de prikolina lucreaza la ei hashingul samd
hai mergi pe google si scrie: google hashing si ai sa vezi imediat :)
 
ei nu au algoritme de cautare care cer timp chiar si acele mai bune; ei folosesc hashingul si o multime de calculatoare in retzea care store toare siturile si care imediat iti intorc paginile odata ce le trimitzi key-ul
 
am cautat putzin pe net. nu prea multe am gasit.
si cred ca am intzeles despre ce vorbesti. asta e indexarea dupa hash-ul cuvintelor. oricum asta e o practica comuna.
deci asta era ideea?
 
Situatia evolueaza (-:


Nota: nu am scopul sa arat ca yahoo/msn e mai bun decit google, ci am scopul sa demonstrez ca google nu este neaparat cel mai bun.

Nota#2: initial discutia era despre calitatea [i.e. relevanta] rezultatelor, insa s-a extins si la facilitatile suplimentare pe care le ofera compania; ei.. fie si asa.



inainte de toate cred ca e bine sa ne amintim cum arata pagina google si cum arata paginile msn si yahoo
Exista o varianta a yahoo care este tot atit de 'descarcata' cum e google. Adica ai un editbox, un buton, si gata; vezi search.yahoo.com


Pe linga aceasta, fiecare din aceste portaluri iti permite sa alcatuiesti o pagina proprie, pe care se afiseaza ceea ce doresti; i.e. in ambele cazuri poti 'deconecta' acele componente care nu te intereseaza, astfel incit sa ramina doar interfata catre search engine.


de la inceput ar fi bine sa fie cunoscta existentza (si aparitzia mai ca in fiecare zi) a modalitatzilor de a limita cautarile pe anumite domenii de care esti interesat:
Y! are o tona de servicii. MSN au mai putine, dar sunt si acolo imagini, harti, stiri, search pe encarta, etc.

Problema consta in aceea ca Y! foloseste denumiri diferite, spre exemplu, cred ca toti stiu de flickr sau despre del.icio.us, blo.gs, dar putini stiu ca aceste chestii apartin Y!.

da, google este permanent in miscare, si cauta mecanisme noi de ameliorare a situatiei, ceea ce este bine, si nimeni nu spune ca este rau. Insa pina cind aceste mecanisme noi sunt implementate si dau roade, lumea poate folosi solutii care deja exista si lucreaza.


Cit despre miserable failure ('vrag naroda' duce catre pagina lui Putin), asta e un proof of concept, care arata ca relevanta rezultatului este mica. Desigur ca ridem la chestia asta, ar fi interesant ca 'jita dracului' sa duca la pagina lui... hmmm.. (-: Dar totusi, inchipuie-ti ca cauti "hash-tables", si in loc de hash-tables esti dusa la pagina "my adventures in Zimbabwe". Feeling lucky today, da?

'google' in genere a devenit verb
Asta e rezultatul unui marketing eficient. Din acelasi motiv lumea numeste orice copier - "Xerox", orice player - "walkman", si orice usb flash disk - "memory stick" (-:
Exemplul tau pune in evidenta popularitatea produsului, si nu calitatea lui.


Si sa ne intoarcem la hash-tables, aceasta este o cale de a optimiza procesul de cautare, ceea ce inseamna ca SE'ul va gasi foarte rapid rezultate irelevante si le va returna, iar jos va aparea inscriptia "search took epsilon seconds". Ideea este ca de data aceasta tu ai scos in evidenta viteza de cautare, si nu calitatea cautarii.
Acest factor cred ca il putem ignora, deoarece pentru un om de rind, caruia ii trebuie citeva secunde ca sa miste mouse'ul la celalalt colt al ecranului, optimizarile de tipul acesta nu au nici-un efect; bottleneck'ul este sistemul nostru motric/vizual/creierul.



Inca ceva, ne spui unde inveti?
 
gr8dude as vrea sa completez contrar sau afirmativ, ceea ce ai zis tu prin aceste articole.

How Google Is Killing the Internet
I bring it up only because I occasionally entertain the thought that Google has, in fact, destroyed the Internet. Well, not the physical Internet, mind you. Just the whole "looking for data" part of it that's key to Google's (alleged) information-based mission. The part that's held the key (so far) to its financial success.

Defining Search Engine Relevancy - 2006
The Short Version

Yahoo!

* been in the search game for many years.
* is better than MSN but nowhere near as good as Google at determining if a link is a natural citation or not.
* has a ton of internal content and a paid inclusion program. both of which give them incentive to bias search results toward commercial results
* things like cheesy off topic reciprocal links still work great in Yahoo!

MSN Search

* new to the search game
* is bad at determining if a link is natural or artificial in nature
* due to sucking at link analysis they place too much weight on the page content
* their poor relevancy algorithms cause a heavy bias toward commercial results
* likes bursty recent links
* new sites that are generally untrusted in other systems can rank quickly in MSN Search
* things like cheesy off topic reciprocal links still work great in MSN Search

Google

* has been in the search game a long time, and saw the web graph when it is much cleaner than the current web graph
* is much better than the other engines at determining if a link is a true editorial citation or an artificial link
* looks for natural link growth over time
* heavily biases search results toward informational resources
* trusts old sites way too much
* a page on a site or subdomain of a site with significant age or link related trust can rank much better than it should, even with no external citations
* they have aggressive duplicate content filters that filter out many pages with similar content
* if a page is obviously focused on a term they may filter the document out for that term. on page variation and link anchor text variation are important. a page with a single reference or a few references of a modifier will frequently outrank pages that are heavily focused on a search phrase containing that modifier
* crawl depth determined not only by link quantity, but also link quality. Excessive low quality links may make your site less likely to be crawled deep or even included in the index.
* things like cheesy off topic reciprocal links are generally ineffective in Google when you consider the associated opportunity cost

Ask

* looks at topical communities
* due to their heavy emphasis on topical communities they are slow to rank sites until they are heavily cited from within their topical community
* due to their limited market share they probably are not worth paying much attention to unless you are in a vertical where they have a strong brand that drives significant search traffic.
 
gr8dude said:
Situatia evolueaza (-:
Pe linga aceasta, fiecare din aceste portaluri iti permite sa alcatuiesti o pagina proprie, pe care se afiseaza ceea ce doresti; i.e. in ambele cazuri poti 'deconecta' acele componente care nu te intereseaza, astfel incit sa ramina doar interfata catre search engine.
google tot are asa varianta, asa ca nu conteaza. si faptul ca trebuie sa scrii 'search' la adresa pentru yahoo e chiar enervant :)

gr8dude said:
Insa pina cind aceste mecanisme noi sunt implementate si dau roade, lumea poate folosi solutii care deja exista si lucreaza.
poate ne dai exemplu de solutii care exista si care te satisfac? si inca o data nu pot sa cred ca negi faptul ca google lucreaza excelent. eu te-am rugat atunci sa dai exemplu din experientza personala cind ai folosit google si nu a lucrat bine pentru tine. eu nu vorbesc in vint cind zic ca am folosit celelalte search engines (si in genere daca vorbim de ele, deja ask.com e mai bun decit yahoo si msn) si nu am fost satisfacuta absolut defel, aceasta nu mi se intimpla niciodata cu google; il ador nu pentry popularitatea lui ci pentru cum lucreaza si asta a luat timp. eu inteleg ca sunt opinii personale, dar mai spun o data - nu e inventzia mea ca google si este in realitate cea mai buna search engine care exista.

gr8dude said:
Cit despre miserable failure ('vrag naroda' duce catre pagina lui Putin), asta e un proof of concept, care arata ca relevanta rezultatului este mica. Desigur ca ridem la chestia asta, ar fi interesant ca 'jita dracului' sa duca la pagina lui... hmmm.. (-:
exemplele care ai dat (cum si ai spus, sunt legendare) poate te intrebi de ce ele inca exista daca ar fi o dovada ca relevantza rezultatului e mica? e o dovada a altui lucru si e foarte simplu: o exprimare politica (din cite stiu acei care au pornit google-ul au invatzat la stanford si cali se stie pentru anti-bush revolte etc) a oamenilor cu capul pe umeri si un simt de umor bine dezvoltat; faptul ca se intimpla si cu putin doar inseamna ca au ceva engineri acolo si din rusia - ma bucur ca au facut asta si cind pot, fac si eu asa o poanta cumva.

gr8dude said:
Dar totusi, inchipuie-ti ca cauti "hash-tables", si in loc de hash-tables esti dusa la pagina "my adventures in Zimbabwe". Feeling lucky today, da
aceasta nu se va intimpla si nu trebuie sa-mi inchipui nimic, parca am spus ca folosesc zilnic :)

gr8dude said:
Asta e rezultatul unui marketing eficient. Din acelasi motiv lumea numeste orice copier - "Xerox", orice player - "walkman", si orice usb flash disk - "memory stick" (-:
Exemplul tau pune in evidenta popularitatea produsului, si nu calitatea lui.
in primul rind nici n-am spus ca ar fi asta vreo dovada ceva a calitatii produsului, asta eu eram 'cute' si am facut o gluma dar anyways
poate te intrebi de ce e chiar atit de popular produsul? daca nu ar da rezultate care oamenii cauta zilnic nu ar fi popular (nici nu are importantza cita advertising ei nu ar face; nu lucreaza inseamna ca nu lucreaza)

gr8dude said:
Si sa ne intoarcem la hash-tables, aceasta este o cale de a optimiza procesul de cautare, ceea ce inseamna ca SE'ul va gasi foarte rapid rezultate irelevante si le va returna, iar jos va aparea inscriptia "search took epsilon seconds". Ideea este ca de data aceasta tu ai scos in evidenta viteza de cautare, si nu calitatea cautarii.
eu chiar si am spus ca asta nu este despre relevanta ci side note ca un plus al cautarii. si recunoaste ca un algoritm de search cit de bun n-ar fi nu ti-ar da nimic de timp constant da?
si de ce zici ca vor fi rezultate irelevante? de unde asa cuvinte serios :) eh... nu vor fi irelevante: deja am descris ce se intimpla pe linga faptul ca se gasesc paginile ce le contin: se face rankingul paginilor, au privilegii paginile cu cuvintele mai aproape unul de altul, in ordine etc etc
e clar ca nu doar iti intoarce ceea ce gaseste fara nici o ordine.
gr8dude said:
Acest factor cred ca il putem ignora, deoarece pentru un om de rind, caruia ii trebuie citeva secunde ca sa miste mouse'ul la celalalt colt al ecranului, optimizarile de tipul acesta nu au nici-un efect; bottleneck'ul este sistemul nostru motric/vizual/creierul.
te inseli foarte mult cind spui asta despre sistemul nostru vizual :), e incredibil cit de repede performam multe din procesele vizuale de zi cu zi (in dependentza de ce facem desigur, oricum asta nu are importantza)
si viteza conteaza pentru multi oameni, foarte multi oameni.

gr8dude said:
Inca ceva, ne spui unde inveti?
iaca asta nu stiu de ce conteaza :)
 
Back
Top