5.4. Előző verzió tárolása

Érdemes megvizsgálni, hogy „előző verzióként” a szűrt vagy a szervertől elkért eredeti adatokat tároljuk. Előbbi esetben minden futáskor csak az újonnan lekért verzióra kell lefuttatni a szűrőket, ami egyértelmű teljesítménynövekedést jelent, bár az eddigi egyszerű szűrők nem igényelnek sok erőforrást. Továbbá biztos, hogy a szűrt adatok mérete kisebb, így ezzel tárhely nyerhető. Különösen jelentős ez a nyereség egy hash‑szűrő alkalmazása esetén.

Hátrányként említhető, hogy az egyes weboldalak rendszerben eltöltött életciklusának elején a finomhangolások miatt sok módosítás várható a szűrés beállításaiban (ideértve az egyes szűrők beállításait és a sorrendjüket is). Ha rendelkezésre állnak az előző verzió eredeti (nem szűrt) adatai, akkor mindkét változatra az új szűrőket futtatva hamarabb kapunk visszajelzést a szűrők tényleges működésének eredményéről. Ezzel elkerülhetőek a tranziens állapotból következő hamis riasztások is. (Tranziens állapot alatt az értendő, amikor az új adatok már az új szűrőbeállítással kerültek szűrésre, míg a régiként tároltak a korábbi beállításokkal lettek szűrve.)

Tehát az eredeti, szűretlen tartalom tárolása mellett szól a kisebb komplexitás és a beállítások gyorsabb érvényre jutása, hátrányaként említhető a nagyobb erőforrás‑használat (CPU és diszk).

Az erőforrásigény szempontjából optimális megoldás valószínűleg egy hibrid, amely mindkét előző módszer megoldását alkalmazza: az első néhány változás megjelenéséig az eredeti tartalmat tárolja, utána csak a szűrt változatot. Ezen vegyes megoldás hátrányaként említhető a komplexitás növekedése, a hibák előfordulásának nagyobb valószínűsége.

Az ideális döntés meghozatalához érdemes megvizsgálni egy, az eredeti tartalmat tároló rendszert, és elemezni a várható nyereséget. A dolgozatom mellékleteként készült programban az eredeti tartalmat tároló megoldást választottam a kisebb komplexitás és a nagy felhasználószám mellett készült mérési adatok hiánya miatt. Mindenesetre megjegyezem, hogy teljesítményproblémák esetén ez is egy optimalizálható pont a rendszerben.

A szűrőket is tartalmazó rendszer aktivitás-diagramja az 5. ábrán látható.

5. ábra: A szűrőket is tartalmazó rendszer aktivitás-diagramja
5. ábra: A szűrőket is tartalmazó rendszer aktivitás-diagramja

Tartalom átvétel