2. Lehetséges megoldások

Az előző fejezetben említésre került, a weblapok figyelésére már létezik néhány elterjedőben lévő megoldás az RSS és az Atom képében. Ezek egy-egy XML formátumot jelentenek, amely formátumok segítségével egy adott weboldal, vagy a weboldal egy részének legutóbbi módosításai írhatóak le. Az újonnan felkerült (esetleg módosult) hírek, hozzászólások címe és a hozzájuk tartozó URL kötelező elemnek számít, amelyeket esetleg további adatok egészítenek ki. Szabványtól függően ilyen lehet például a hír dátuma, publikálásának időpontja, szerző neve, bevezető a tartalomból, vagy akár maga az egész tartalom is.

Az egyszerűség kedvéért (és a mindennapi szóhasználatnak megfelelően) a továbbiakban többnyire csak RSS-ként fogok ezekre az XML formátumokra hivatkozni, bár a legtöbb esetben az Atom is tökéletesen megfelelő kifejezés lenne az RSS helyett vagy mellett.

Az ezen formátumban közreadott csatornákhoz számos – ingyenesen is használható – ún. aggregátorprogram létezik, amelyek képesek őket megadott időközönként letölteni a távoli kiszolgálóról, majd különféle módokon értesíteni tudják a felhasználót az esetleges új tartalmakról, illetve a korábbiak változásáról. Az értesítés lehet nagyon hasonló egy új e‑mail érkezésének jelzéséhez asztali levelezőprogram esetén, de a felugró ablak, vagy a megváltozott ikon is gyakori megoldásnak számít. Az RSS-eket az elterjedtebb böngészőprogramok kivétel nélkül támogatják (Internet Explorer a 7-es verziójától, a Firefox a kezdetektől), így a legtöbb gépen a böngészőn kívül más programra nincs is szükség ezen csatornák figyeléséhez.

Sajnos a weblapok egy része egyáltalán nem rendelkezik ilyen speciális, az aggregátorprogramok számára készült XML csatornával. A modern tartalomkezelő rendszerek (CMS, Content Management System) többsége alapértelmezetten támogatja a hírek ilyen formában történő megosztását, de korántsem áll minden weboldal mögött ilyen rendszer. A „kézzel” (HTML szerkesztővel) írt weboldalakhoz is bonyolult lenne ilyen RSS csatornák előállítása, más rendszerekhez pedig külön fejlesztést igényelne.

A helyzetet orvosolandó felmerülhet, hogy megpróbáljuk rábeszélni az oldalak karbantartóit, fejlesztőit az adott oldalhoz tartozó RSS fájlok biztosítására. Sajnos a weblapot üzemeltetők egy része valószínűleg nem is akar ezzel foglalkozni, másik részük pedig nem tekinti fontosnak, hogy ezzel is a látogatók kedvében járjon, időt spóroljon nekik. Ha esetleg mégis sikerül meggyőzni egy-egy webmestert, akkor sem garantálható a gyors változás. Sajnos manapság még nem számít alapkövetelménynek egy weblap esetén az RSS csatornák megléte. Jelenleg az RSS felhasználóinak száma elég csekély, ami egy erős érv az RSS ellen.

Alternatív megoldás egy olyan program készítése, amely képes az általunk fontosnak tartott weboldalak változásainak jelzésére. Elvárás, hogy az ellenőrzést periodikusan, megadott időközönként automatikusan képes legyen elvégezni.

A program algoritmusa valószínűleg hasonlítani fog a manuális folyamat algoritmusához. Azt, hogy változott-e egy weboldal tartalma, a legtöbb esetben egyszerű eldönteni. Megnézzük az oldalt, majd összehasonlítjuk a korábban látottal.

A pontos algoritmus tehát a következő: egy korábbi lekérdezés eltárolt eredményét (akár bájtról-bájtra) összehasonlítva egy frissen végzettével rögtön kiderül, hogy változott‑e valami az adott oldalon. Ha van változás, akkor eltároljuk a most letöltött verziót „korábbiként”, majd értesítjük a felhasználót a módosításról. Ha nincs változás, akkor nincs teendő. Az első futtatásnál értelemszerűen csak a tárolást kell elvégezni (ekkor még nincs „korábbi” változatunk).

Tartalom átvétel