DMS vs FileSystem vs NEW!

Serverruimte
“Voor bedrijven is kennis van mega belang en dit zal in een steeds groter wordende kenniseconomie alleen maar toenemen. Doordat prijzen onder druk staan en werknemers minder trouw geworden zijn is het behoud van kennis, inwerken van nieuwe medewerkers en het hergebruiken van deze kennis noodzakelijk om te overleven. Vaak is deze kennis ingekapseld in talloze Word en Pdf documenten, Powerpoint presentaties en Excel sheets die overal en nergens in de organisatie rondzwerven. NAS en SAN oplossingen staan bol van de gigabytes aan data en het overzicht is ver te zoeken. Systeembeheer prikt hier en daar nog een netwerkschijfje bij om de (volgens de regel) jaarlijkse verdubbeling van documenten te kunnen ondersteunen. Gebruikers slaan lokaal bestanden op omdat het niet meer in de structuur past of omdat het gewoon ‘database huggers’ zijn. Omdat de naam van een document het enige karakteristieke van een bestand is worden bestanden op netwerkschijven door andere gebruikers overschreven met oudere versies.
Mocht je de mazzel hebben dat je een organisatie werkt met een reactief management, dan besluit deze uiteraard om voor een paar ton een draak van een Document Management Systeem aan te schaffen. Een lading consultants wordt door een willekeurige ‘automatiseerder’ naar binnen geschoven om nieuwe werkwijzes, categorisatiemethodes en cultuurveranderingen door de strotten van de werknemers te drukken. Als klap op de vuurpijl besluit de (door verkeerde bezuinigingen verouderde / niet vervangen) fileserver er mee op te houden en is de G-schijf niet meer te vinden onder Windows Verkenner.”
Wellicht is deze introductie iets te zwaar aangezet, maar voor kennisorganisaties is dit een ware nachtmerrie welke hier en daar al de orde van de dag is. Ook geloof ik dat er lezers zijn die hun organisatie hierin toch een beetje herkennen. Op zich had ik nog wel een alinea of drie door kunnen gaan met organisaties die een traject van jaren achter de rug hebben om al hun documenten te metadateren en nog niets terug kunnen vinden, documenten niet gebackupped worden en werknemers in de buitendienst in een hotel niet bij hun data kunnen en alles toch maar weer lokaal opslaan. Om nog maar niet te spreken van de tijd die het kost om een bestand in een DMS te plaatsen.
- Semantische indeling / categorisatie
- Versiebeheer
- Metadatering
- Authorisatie / Security
- On- en offline synchronisatie
- Backups
In deze blog wil ik graag (mijn / een) idee pitchen over een transparante opslagmethode ter vervanging van Document Management Systemen. In hoofdlijnen komt het neer op een soort van datawarehouse of filedatabase. Voor de gebruiker is het een schijficoontje waar bestanden opgeslagen kunnen worden en/of een schijficoontje op je desktop waar je een bestand of directory op kan slepen.
Semantische indeling / naamsgeving
Een bestand behoord vaak niet tot één categorie of onderwerp. Om deze reden is een hierarchische structuur niet langer bruikbaar en zal een semantische structuur van onderlinge verbanden noodzakelijk zijn. Het bestand zal binnen het platform een identifier krijgen, zodat dubbele namen ook verleden tijd zijn.Metadatering / tagging
Gebruik makend van de huidige techniek binnen Enterprise Search Engines worden documenten voorzien van een automatisch gegenereerde samenvatting, HTML preview versie en metadatering in de vorm van keywords / tags. Eventueel zouden deze keywords / tags ter goedkeuring aan de gebruiker getoond kunnen worden.Versiebeheer
Op basis van bepaalde logica kan versiebeheer toegepast worden. Dit in tegenstelling tot enkel de directory en bestandsnaam waarop versiebeheer in de huidige vorm toegepast wordt.Authorisatie / security
Voor Windows gebruikers is het normaal dat security settings van bestanden overgenomen worden van de bovenliggende map. Aangezien deze structuur niet aanwezig is wordt gekozen voor het toch al mooiere model wat binnen Unix gehanteerd wordt. Met de mogelijkheden voor read, write en execute kan per bestand aangegeven wordt welke rollen, groepen en / of gebruikers toegang hebben tot het bestand.Opslag en backups
Omdat het voor de gebruikers niet interessant is waar zijn / haar data precies opgeslagen is kan het platform over één of meerdere SAN / NAS oplossingen geplaatst worden. Dit kan tevens een oplossing zijn ter bevordering van de performance. Tevens kan vanuit het oogpunt van datawaarborging CRC checks ingebouwd worden. Om de grootte te reduceren zou compressie toegevoegd kunnen worden.On- en offline synchronisatie
De voor de gebruiker relevante documenten zijn indien gewenst voor elke gebruiker op zijn/haar werkstation toegankelijk. Een afgeslankte versie van het datawarehouse is dan lokaal beschikbaar.
Defaults, standaarden en profielen
Bovenstaande zou kunnen impliceren dat door de gebruiker nog steeds een X aantal handelingen verricht moeten worden om een document in het platform te krijgen. In mijn optiek zijn een aantal handelingen daadwerkelijk noodzakelijk maar zou dit tot een minimum beperkt kunnen worden door te werken met defaults, standaard metadatering, profielen voor bepaalde bestanden en batchgewijs toevoegen.
Modulaire opzet en API
Om bovenstaande alinea nog meer aan te scherpen kan er tevens van uitgegaan worden dat het platform modulair opgezet is. Dit zou in kunnen houden dat eigen implementaties van de verschillende features mogelijk is. Zo zou er gekozen kunnen worden om voor bepaalde rollen van gebruikers een thesaurus te hanteren voor het metadateren, etc. Tevens is het systeem voorzien van meerdere API’s voor bijvoorbeeld Java, .Net en een XML koppeling.
Weergave
Zoals elke goed systeem is in dit platform de weergave losgekoppeld van de logica en de opslag. Dit houdt in dat het voor organisaties mogelijk is om een eigen weergave er overheen te plaatsen. In theorie zou het mogelijk zijn om een Windows Verkenner, Aquabrowser of Enterprise Search tool eraan te koppelen.
Toepassingsgebieden
Het systeem is vooral geschikt voor grote hoeveelheden (losse Word, Pdf, etc.) documenten. Bijvoorbeeld voor softwareontwikkeling waar onderlinge samenhang van documenten belangrijk is zal dit niet / minder goed werken. Voordeel zou tevens kunnen zijn dat er geen afhankelijkheid is naar het Operating System en Apple, Linux en Windows machines gezamelijk gebruik kunnen maken van dezelfde opslag.
Over de auteur
Ikzelf behoor (helaas) tot de groep van notoire archiveerders en loop dan ook vaak tegen het probleem ‘in welke map moet dit mailtje nu weer’ aan. Uit deze frustratie is bovenstaand idee ontsproten. Enthousiast als ik ben heb ik nog geen onderzoek op internet gedaan of een soortgelijk systeem reeds aanwezig is, maar dat zal de komende week uitwijzen. Tot slot is op advies van Ger nog even op ZFS gezocht en is deze blog nog aangevuld met wat krachttermen van Sun.
Reageren?




