Pieter  Wahle
WebSphere beheerder

Onze Partners

Open Source zoektechnologie

MINT is één van de eerste partijen in Nederland die vanaf het begin betrokken is geweest bij de ontwikkeling van Lucene en heeft ruime ervaring en kennis opgebouwd met zowel Lucene als de sub-projecten: Nutch, Hadoop en Solr. Lucene is een krachtige uitgebreide software bibliotheek voor indexeren en zoeken binnen tekst. Nutch is een Open Source zoekmachine gebaseerd op Lucene. Dankzij Hadoop (het Google MapReduce principe) is Nutch zeer schaalbaar en kan meegroeien met uw organisatie.

Solr is ook gebaseerd op Lucene, maar is in tegenstelling tot Nutch niet ontworpen voor het indexeren van collecties van bestanden in allerlei formaten. Solr indexeert gestructureerde data (als XML en JSON). Hierdoor wordt het mogelijk gemaakt om het systeem op een eenvoudige manier zeer krachtige vragen te stellen (vergelijkbaar met relationele databases) en de formattering van de antwoorden zelf te bepalen en bijvoorbeeld te sorteren op elk gewenst aantal velden. Hierbij wordt gebruik gemaakt van de eenvoudige Lucene Query Language.

Apache Software Foundation

Lucene wordt ontwikkeld door de Apache Software Foundation en heeft een begin gemaakt met het realiseren van een open-source webzoekmachine. De software is gratis te gebruiken, wel moet deze door een specialist nog worden ingebouwd in het content management systeem (CMS) van een website, intranet of bedrijfsportal. MINT is o.a. gespecialiseerd in het inrichten van Lucene in Corparate Intranets, integratie met XML gebaseerde CMS en het inrichten van zoeksystemen op basis van Nutch / Hadoop.

Open Source

Open Source biedt een transparant alternatief voor de commerciële zoekmachines. Het ranking mechanisme (rangorde van treffers) is in tegenstelling tot commerciële oplossingen openbaar en kan naar eigen behoefte aangepast worden.

 

Voordelen Lucene/ Nutch

- Ondersteuning meerdere talen en detecteert deze automatisch.
- Geavanceerde en flexibele ranking van zoekresultaten.
- Volledige set zoekfuncties, zoals specifieke velden (metadata, bestandstype, titel, url, datum (reeksen), (sub) domeinen, taal, bestandsgrootte, anchor texten, inkomende links, pagina's die verwijzen naar, soortgelijke pagina's, etc.
- Gebaseerd op plug-in structuur waardoor functionaliteit eenvoudig is toe te voegen.
- Standaard ondersteuning voor meerdere bestandsformaten zoals HTML, text, PDF, MS Office, OpenOffice en verschillende archief formaten (zip, tar, tgz).
- Geavanceerde mogelijkheden zoals ontologie en clustering (carrot2).
- Hoge schaalbaarheid (tot en met het gehele world wide web) dankzij Hadoop.
- Geen licentiekosten.

Bent u op zoek naar een zoekoplossing voor uw intranet / extranet dan zijn wij graag bereid om kostenloos, een op uw situatie aangepaste demo te verzorgen (tot 1M pagina's). Voor meer informatie kunt u contact met ons opnemen.
Nieuws
01-07-2008
MINT, ICT- en Portalspecialist uit Reeuwijk, is de nieuwe partner van Microsoft
Nieuwsbrief
Kent u de MINT e-mail nieuwsbrief al? Vul hieronder uw e-mailadres in om u aan te melden voor onze nieuwsbrieven. Abonneer u nu en maak kans op een USB Memory stick of een éénjarig lidmaatschap van SNUG.
E-mail adres