Apache Lucene is de meestgebruikte zoekmachine in CMS-land. Deze open source zoekmachine heeft veel te bieden, maar is zeker geen ‘klik-en-klaar’-systeem.
Johan Zwiekhorst schreef een uitstekende analyse over Apache Lucene. Zijn conclusie: “De grote voordelen van Apache Lucene is dat het razendsnel is, open source en gratis. Het is echter geen klant-en-klare zoekmachine en er horen nog heel wat modules bij om het echt bruikbaar te maken voor een bedrijf. Maar juist omdat het modulair is, krijg je wel het maximum aan keuzevrijheid.”
Het huidige bijna-monopolie van Google, is slecht voor de innovatie van zoekmachines.
Tot die conclusie komen twee onderzoekers van de Universiteit van Tilburg. De kwaliteit van zoekmachines is afhankelijk van het algoritme dat het zoekproces stuurt en de kennis die het systeem heeft opgedaan door het klikgedrag van gebruikers, stellen Cédric Argenton en Jens Prüfer van Tilburg University in hun onderzoek getiteld ‘Search Engine Competition with Network Externalities’.
Customer service experience organisatie RightNow heeft het Nederlandse ‘natuurlijke taal’ zoekbedrijf Q-go gekocht voor $34 miljoen.
Deze acquisitie moet de klantbeleving bij het zoeken en het bezoeken van websites van klanten van RightNow verbeteren.
RightNow is tamelijk ambitieus door te voorspellen dat de overname zal leiden tot $ 8 miljoen extra omzet zal leiden in 2011. RightNow verwacht een totale omzet van $ 51 miljoen in het vierde kwartaal van 2010.
Dit heeft als voordeel dat je direct ziet wat het zoekresultaat is. Je hoeft niet meer op ‘Search’ – of ‘I feel lucky’ – te klikken. Dit bespaart tijd, aldus Google. Maar Google gaat verder: je krijgt het zoekresultaat voordát je typt. Er wordt al door Google voorspeld wat je wilt gaan zoeken.
CMS Watch analyst Tony Byrne schreef een interessant artikel over de overschatting van search tools.
Tony neemt Autonomy als voorbeeld. Deze ‘Rolls Royce onder de search tools’ is enorm krachtig, maar ook complex. Autonomy heeft de afgelopen tijd veel tools overgenomen, waaronder Verity en Interwoven. Hij waarschuwt dat Autonomy IDOL op het gebied van digital asset management (DAM) en web content management (WCM) wat verouderde technologie inzet, wat de zaak nog complexer – en kostbaarder – maakt bij specifieke eisen.
Kernboodschap: laat search niet de boventoon voeren in je content management project. “(…) you risk getting sidetracked from your original goal of, say, creating a user-friendly repository for your 50,000 Office documents.”
Mijn eigen ervaring is dat de keuze voor een search tool juist ondergesneeuwd is in de meeste content management projecten. Men gaat er vaak van uit dat search wel wordt geregeld door de cms-leverancier of de implementatiepartner. Men vindt search wel heel belangrijk, maar besteedt er te weinig aandacht en tijd aan. Met slechte zoekresultaten als gevolg.
Wie meer wil weten over search tools kan terecht bij HartmanGIDS.nl. Deze website beschrijft 8 search tools: Apache Solr, Apache Lucene, Coveo Enterprise Search, Exalead Cloudview, Google Search Appliance (GSA) en ISYS Search.
Europa wil leveranciers van zoekmachines verplichten om de zoekgegevens van gebruikers twee jaar te bewaren voor opsporingsdoeleinden. Nu is die termijn zes maanden.
Dat staat in een richtlijn die is aangenomen door het Europees Parlement. Door gegevens langer te bewaren moet criminaliteit via internet sneller worden opgespoord. Tegenstanders vinden de richtlijn een schending van de privacy van gebruikers. “Dit roept herinneringen op aan de Oost-Duitse Stasi.”
Bing is de aanval geopend op Google met een interessante insteek: Bing is beslissingsmachine en Google ‘slechts’ een zoekmachine.
Het is een interessante maar gewaagde insteek. Kan Bing dit waarmaken? Het is Wolfram Alpha in elk geval niet gelukt.
De booschap ‘What has information overload done to us?” spreekt mij bijzonder aan. Hierover ga ik spreken in de track ‘Online communication’ op het J. Boye 2010 congres in Philadelphia. Dit filmpje ga ik dus zeker laten zien.
‘Googlen’ is een werkwoord en voor veel mensen het summum van ‘Internet-genot’. Bij Google zelf zijn ze op dat punt gelukkig wat (zelf)kritischer.
Wired-redacteur Steven Levy beschrijft hoe Google met man en macht aan de optimalisatie van Search werkt. En hoe het de vele vele Google-gebruikers daarbij gebruikt: “Just about every time you search on Google, you’re a lab rat.”
Learn from 19 best practices in information management. With Microsoft, HP, Motorola, World Bank, KPN/Getronics, Harvard Business School, Essex County Council, Canadian Department of National Defence, Telstra, Wienerberger, and others.