Repozytorium dokumentów elektronicznych pełni kluczową role w EZD. Brak dokumentacji papierowej powoduje, że jest to system krytyczny. Dokumenty zawierają cenne dane, podlegające pod RODO a często także dane wrażliwe. Repozytorium powinno być solidne, proste, zabezpieczone przed atakami i odporne na awarię. Stanowi back-end dla innych serwisów, samo nie powinno zależeć od innych komponentów. Repozytorium przechowuje dane w ich pierwotnej formie. Metadane dokumentów w rozumieniu ustawy powinny być przechowywane w komplementarnym systemie (Szafa EZD).
Repozytorium dokumentów elektronicznych stanowi najcenniejszy zasób IT jednostki, za który odpowiada Wydział Informatyki. Podjecie do tematu repozytorium ustali status wydziału na kolejne lata. Jeżeli weźmie za nie odpowiedzialność samodzielnie, może zacząć być postrzegany jako wydział kluczowy.
Repozytorium dokumentów elektronicznych zawiera dokumenty elektroniczne stanowiące akta właściwe oraz uzupełniającą dokumentację potwierdzającą czynności wykonane nad aktami. Dokument elektroniczny w EZD jest plikiem z przypisanym publicznym, jednoznacznym identyfikatorem. Format identyfikatora precyzuje ustawa. Każda pozycja repozytorium przechowywana jest pod jednoznacznym identyfikatorem dokumentu. Repozytorium powinno zapewnić tylko podstawowe funkcjonalności:
Bezpieczne zapisanie dokumentu pod jego identyfikatorem
Pobranie dokumenty dla zadanego identyfikatora
Zbrakowanie dokumentu dla zdanego identyfikatora
Zabezpieczenie dostępu do dokumentów
Zabezpieczenie przed utrata danych z powodu nadpisania
Po pierwsze trzeba ustalić gdzie będziemy składować dane, lokalnie czy w chmurze.
Trzymanie krytycznych zasobów lokalnie zapewnia pełna kontrole nad danymi ale wymusza też pełną odpowiedzialność za dane od najniższej warstwy sprzętowej przez zapewnienie właściwego backupu i infrastruktury zapewniającej odporność na awarię. Ten wybór powinien być pierwszym w jednostkach, które posiadają nowoczesną infrastrukturę IT, którą potrafią prawidłowo zarządzać.
Wszystkie chmury obliczeniowe zapewniają bazę niskopoziomowych usług składowania danych: Amazon S3, Google Cloud Storage, Azure Storage. Stabilny, bezpieczny dostęp do zasobów chmurowych wymaga połączenie infrastruktury sieciowej jednostki i chmury. Utrzymywanie krytycznych danych jednostki w infrastrukturze chmurowej wymaga dobrego zrozumienia korzyści, ryzyk i kosztów z tym związanych.
Zabezpieczenie danych obejmuje niezmienność raz osadzonych danych, kontrolę antywirusową, backup i redundancje. Kontrola dostępu obejmuje właściwy dostęp do dokumentów w rejestrze, oraz kontrolę osadzania dokumentów w rejestrze. Dostęp do dokumentów może być łatwo zrealizowany w oparciu o proste listy dostępu. Kontrola osadzania opiera się prawie zawsze na regułach biznesowych i wymaga rozważnej implementacji.
Dostęp do danych w składzie powinien być szczególnie chroniony, nie można porostu udostępnić składu przez wsþóldzilenie dysku, do tego celu trzeba zaimplementować warstwę implementująca API repozytorium dokumentów elektronicznych. Przygotowaliśmy propozycje takiego API w postaci OpenAPI v.3. Ponieważ API jest proste, struktura repozytorium zrozumiała implementacja tez będzie prosta, można ja wykonać samodzielnie, zlecić przygotowanie kodu lokalnej firmie, lub skorzystać z AI do jej wygenerowania. Ważne żeby przygotować specyfikację precyzującą wymagania, cały kod był w posiadaniu jednostki i był w pełni zrozumiały dla Wydziału Informatyki.