De nieuwe, nieuwe Google
| Uitgegeven: | 22 april 2011 10:36 |
| Laatst gewijzigd: | 22 april 2011 10:40 |
Persoonlijk vind ik niet altijd meer wat ik zoek via onze grote vriend Google. Reden te meer om verder te gaan met het ontwikkelen van een eigen zoekmachine. Maar dat brengt toch problemen met zich mee.
Ik ben in de paar vrije uurtjes die ik zo nu en dan heb, toch bezig gegaan met het ontwikkelen van een ‘nieuwe’ zoekmachine. En met succes, want de meeste algemene zoekopdrachten die ik intik hebben hele goede, relevante zoekresultaten. Het probleem zit hem in de capaciteit.
Het verwerken van de websites is een proces dat goed te automatiseren is. Aan de hand van de onderliggende HTML kun je distilleren wat relevant is aan de pagina en wat niet. Het nadeel is echter dat het ‘lezen’ van de pagina een bepaalde tijd kost en het opslaan van alle relevante elementen in de database ook. Met andere woorden: lastig verhaal.
Geparkeerd
Op dit moment heb ik ongeveer 2 miljoen geïndexeerde websites, waarvan er ongeveer 1,6 .nl domeinnamen zijn. Er zijn ongeveer 4,4 miljoen Nederlandse domeinnamen in gebruik volgens de domeinteller van de SIDN. Dan begin ik al een beetje op weg te komen zou je zeggen!
Op zich zit daar wel wat in. Een hoop domeinnamen zijn ‘geparkeerd’ en worden helemaal niet gebruikt, een ander deel is simpelweg een kopie van een andere website. Misschien blijven er dan maar 2 miljoen over. Of misschien zelfs wel 1,6.
Uitdaging
Hoe dan ook is het een langdurig proces om een goede zoekmachine te ontwikkelen. Het is niet de bedoeling dat ik Google eruit concurreer (laten we reëel blijven), maar wat kwaliteit betreft mag ik er niet voor onder doen. Een ongelooflijk leuke uitdaging, zeker nu ik de zoekmachine vorm zie krijgen!
De toepassingen zijn legio. Met het indexeren van pagina’s kun je ook andere informatie over de domeinnamen verzamelen. Gemiddelde laadtijd, ip-adressen, et cetera. Daarmee vorm ik eigenlijk een database met enorm veel gegevens over, van en uit ‘het internet’. En hoe gaaf is dat!
Lees hier mijn eerdere blog 'De nieuwe Google'.
| © NUzakelijk |
- ZZP'ers zijn ondernemers
- Het ‘X weken plan’
- Iets meer geduld
- Zijn uw gegevens veilig?
- Groen, groener, groenst
- Geen crisis, maar fundamenteel probleem
- Apple versus Samsung
- Groeien is de grootste kick
- Het dak repareren als de zon nog schijnt
- Maatschappelijk verantwoorde onzin
- Tot in het kleinste detail
- Geld heeft geen waarde
- Asociale media
- Snel geld verdienen
- Snap jij het of snap ik het
- De lomperik en de klant
- Snel naar de top met SecondLife
- Ik ben benieuwd
- Groot denken, klein blijven
- De nieuwe, nieuwe Google
- Personal Branding
- Echt innoveren doen we niet
- 'Ondernemers denken te groot'
- Geven en nemen
- Survival instinct
- Software vervangen?
- Administratieheld
- Geluk gekocht?
- Mijn draai gevonden
- Verbanden leggen
- De fanatieke netwerker
- Kunstmatige intelligentie
- Wat anders doen
- Mijn jaar!
- Twijfels over Wikileaks
- Het to-do-lijstje
- Heerlijk vak!
- Gelukkig heb ik een boekhouder
- Een hoop te leren
- Het goede gevoel
- Urenregistratie en een deadline
- Wat meer geld
- Het vakantiegevoel
- The Grid
- De nieuwe Google?
- Terug naar de tekentafel
- De dag is al zo kort
- Dát bestond al
- Automatisch, maar niet vanzelf
Ondernemersblog: Helma en Eelkje
|
'Met zo’n plan op zak kom je er wel, moeten veel ondernemers denken die een adviseur inhuren.' |