Indicizzazione automatica dei documenti


Uno dei problemi più impegnativi riguardanti l’adozione di un sistema di gestione documentale, riguarda la creazione degli indici di ricerca.

Alfresco è uno strumento potentissimo da questo punto di vista, una volta indicizzati i documenti non ci sono limiti a quello che si può realizzare. Il problema è, appunto, la determinazione dei metadati di ciascun documento.

Per agganciare a ciascun documento i corretti metadati è tipicamente necessario andare ad interrogare il sistema che ha generato il documento; se tale sistema è aziendale allora il problema non è banale ma è risolvibile, se invece il generante è esterno all’azienda allora il compito è quasi impossibile.

Per risolvere in modo facile (dal punto di vista Alfresco) questo problema è possibile utilizzare strumenti come METAQRCODE (http://www.metaqrcode.com). L’idea alla base dello strumento è molto semplice : chi produce il documento conosce i metadati, quindi può impacchettarli in un documento XML che “inserisce” in un QRCODE. IlQRCODE viene aggiunto al documento.

In questo modo chi legge il documento, e legge il QRCODE, ha la possibilità di ottenere i metadati XML e generare automaticamente i metadati di indicizzazione di Alfresco.

 

il futuro di sinekarta


Prendendo spunto da diverse richieste che arrivano via mail, tiro le fila dello stato del progetto.

L’anno scorso è entrata in vigore la nuova normativa riguardante la conservazione sostitutiva (http://www.anorc.it/notizia/547_Pubblicate_in_G.U._le_Regole_tecniche__arriva_il_nuovo_%EF%BF%BDsistema_di_conserva.html).
La nuova normativa ha stravolto completamente le logiche che un sistema di conservazione deve implementare, vanificando di fatto tutto il lavoro fatto con sinekarta.
Questa prevede che un sistema di conservazione basi le proprie logiche sullo standard OAIS (Open Archival Information System – http://en.wikipedia.org/wiki/Open_Archival_Information_System), la vecchia normativa invece era decisamente lasca sugli aspetti software. Le specifiche OAIS sono un mondo MOLTO diverso da Alfresco, il progetto sinekarta è quindi totalmente incompatibile con la nuova normativa.
Oltre agli aspetti tecnici, la nuova normativa introduce maggiori vincoli riguardo gli aspetti burocratici del processo, alzando di fatto l’asticella che rende sensata l’implementazione della conservazione sostitutiva in house.
La stima che abbiamo fatto internamente è che se la vecchia normativa rendeva sensata l’adozione di un sistema di conservazione in house al raggiungimento dei 30.000 documenti da conservare l’anno, con la nuova normativa questo limite si è alzato a 100.000 documenti.
Quindi un’azienda che intende adottare un sistema di conservazione in house rientrerà del proprio investimento solo se supera la soglia dei 100.000 documenti l’anno.
Se a questo aggiungiamo la proliferazione di servizi in outsourcing a basso costo (es. http://www.fatturafacile.com/), diventa evidente che il futuro della conservazione sostitutiva è nel cloud.

Questa premessa per spiegare un po’ l’attuale scenario in cui ci muoviamo, ora parliamo invece un po’ della storia del progetto sinekarta.

Quando sinekarta è partito (nel 2010) il mercato era già saturo di soluzioni di conservazione (la vecchia normativa risale infatti al 2004), il progetto non ha quindi MAI riscontrato un particolare successo. In altre parole è stato un bel progetto da realizzare, ci ha dato tante soddisfazioni in termini di visibilità e di competenze su Alfresco, ma i ritorni economici non si sono avvicinati neanche lontanamente allo sforzo sostenuto per la realizzazione.
Con l’uscita della nuova normativa ci siamo quindi chiesti se valesse la pena continuare ad investire sulla conservazione sostitutiva e la risposta, purtroppo, è stata NO. Visto quanto detto fino ad ora, non ci sono le premesse per continuare ad investire in tale direzione.

Il futuro del progetto sinekarta.

Non tutte le speranze sono però perdute. Sinekarta NON è morto, si sta trasformando. Abbiamo rilasciato una nuova versione di sinekarta (https://github.com/Sinekarta/sinekarta) che implementa (su Alfresco) tutti i tipi di firma digitale e firma elettronica (CADES, PADES, XADES) su qualsiasi tipo di documento. Questa nuova versione è distribuita come amp ed è meglio compatibile con Alfresco (attualmente 4.2.f).
Abbiamo inoltre rilasciato un altro plugin di Alfresco (sempre amp su 4.2.f) che permette la conversione di qualsiasi documento in pdf/a (https://github.com/Sinekarta/sinekarta-pdfa).
Stiamo lavorando, in collaborazione con un outsourcer della conservazione (http://www.indicom.biz/), ad un protocollo aperto per l’accesso ad un sistema di conservazione generico. Su questo protocollo (che ci piacerebbe diventasse uno “standard di fatto”) stiamo implementando un plugin di Alfresco.
Questa strategia, per l’azienda che vuole adottare la conservazione sostitutiva, ha almeno due punti interessanti :

  • l’azienda utilizza Alfresco come front-end per il sistema di conservazione. Vede i propri documenti sulla propria rete ed Alfresco si preoccupa, in autonomia ed in automatico, di riversare sul sistema di conservazione solo alcuni documenti.
  • se/quando diversi outsourcer implementeranno questo protocollo, il cliente potrà cambiare outsourcer con pochissimo sforzo

Infine è opportuno parlare dell’integrazione con le MFP Toshiba.

La partnership con Toshiba prosegue ed il progetto che abbiamo implementato (SinekartaMFP) è in uso in diverse aziende. Rispetto a quanto si vede nel video pubblicato sul sito di sinekarta sono state aggiunte molte funzionalità evolute (lettura barcode/qrcode, ocr, zoned ocr, digitazione manuale dei metadati, etc…) ed è diventato uno strumento decisamente UTILE per quelle aziende che intendono dematerializzare senza per forza andare in conservazione sostitutiva.

Rilasciata la versione 2.0.1 GA di SineKarta


Tante cose sono cambiate negli ultimi 6 mesi.

La più importante riguarda Alfresco, è stata rilasciata la versione 4.2 che introduce diverse migliorie MOLTO interessanti. La nuova versione di Sinekarta è pienamente compatibile con questa versione di Alfresco.

La maggior parte dei nostri utenti utilizzano server Linux, per questo abbiamo fatto in modo che l’installer funzionasse anche su questo tipo di sistemi operativi (per ora solo Ubuntu).

Proprio per agevolare le installazioni server, l’installer è in grado di lavorare anche in modalità testo, utilizzando la comoda opzione -console da utilizzare a linea di comando.

Infine abbiamo risolto alcuni bug e migliorato le performance del sistema.

Non vi resta che provare la nuova versione di SineKarta e farci sapere cosa ne pensate!

ARGH!!! Le ricerche in Alfresco hanno smesso di funzionare!!


Molti di voi si saranno accorti del problema legato alla versione 4.0.d Community.
Per quelli di voi che hanno urgenza di risolvere la situazione, eccovi il link al wiki di sinekarta che descrive la soluzione.
Se siete arrivati fin qui significa che volete approfondire il problema, eccovi quindi alcune (poche) indicazioni riguardo la natura dell’intoppo.
Come di certo saprete Alfresco 4.0 introduce SOLR, uno strumento molto potente, “esterno” ad Alfresco tramite il quale sono eseguite le ricerche.
Alfresco utilizza dei servizi HTTPS esposti da SOLR per eseguire le query.
Il certificato necessario per la comunicazione HTTPS inserito in Alfresco (fino alla versione 4.0.d) purtroppo scadeva il 17 Agosto, per questo dopo tale data le ricerche hanno smesso completamente di funzionare.
Il BUG non è software, basta rigenerare il certificato e tutto ricomincerà a funzionare senza problemi.

Benvenuto SineKarta Protocollo Informatico


E’ giunta l’ora di togliere il velo di mistero riguardo il progetto SineKarta Protocollo Informatico.

L’inizio di questa storia risale ormai a quasi un’anno fa. Era Luglio 2011 quando siamo stati contattati per la prima volta da TLogic, una interessante realtà  veneta che lavora con Alfresco.

Il feeling è stato immediato per diversi motivi: le dimensioni delle due aziende sono simili, i temi sui quali operiamo sono gli stessi, la filosofia open source abbracciata da JENIA Software è in linea con le strategie di TLogic.

Inoltre TLogic aveva già  un software che implementava il Protocollo Informatico compatibilmente con le regole DigitPA (ex. CNIPA) e stava studiando la possibilità  di adattarlo ad Alfresco.

Come molti di voi sanno il Protocollo Informatico, soprattutto per la Pubblica Amministrazione, è strettamente collegabile alla Firma Digitale ed alla Conservazione Sostitutiva, tant’è¨ che anche JENIA Software stava per implementare questa parte della normativa.

Quando gli amici di TLogic ci hanno proposto di unire le forze per creare una soluzione integrata sotto l’unico cappello di SineKarta, ci siamo detti, perchè no?

Se non coltiviamo una strategia di condivisione in un progetto open source come SineKarta, significa non avere capito niente!!!

SineKarta Protocollo Informatico è open source e rilasciato sotto la licenza GPL, esattamente come SineKarta; come quest’ultimo (e come Alfresco) è disponibile in edizione Community ed Enterprise.

SineKartaPI ha appena emesso il primo vagito, è stata rilasciata da pochi giorni la prima versione beta. C’è ancora della strada da fare per raggiungere la maturità  di SineKarta, ma il grosso del lavoro è stato fatto, provatelo e contribuite alla sua crescita.