U nedavnoj studiji, istraživači sa Université de Montréal i Flare Systems su pokazali da veliki jezički modeli (LLM) mogu precizno izdvojiti kritične podatke o sajber prijetnjama (CTI) iz foruma o sajber kriminalu sa impresivnih 98% preciznosti. Nalazi, objavljeni u bijeloj knjizi, naglašavaju ogroman potencijal vještačke inteligencije u jačanju napora u oblasti sajber sigurnosti.
Istraživački tim, predvođen Vanessom Clairoux-Trépanier i Isa-May Beauchamp sa Fakulteta za kriminologiju na Univerzitetu u Montrealu, u saradnji sa Flare Systems, razvio je LLM sistem koji pokreće OpenAI GPT-3.5-turbo model.
Ovaj sistem je analizirao razgovore sa tri istaknuta foruma o sajber kriminalu: XSS, Exploit.in i RAMP.
„Naš cilj je bio da procijenimo tačnost i efikasnost LLM-a u izvlačenju ključnih CTI informacija sa ovih foruma, za koje se zna da sadrže opsežne rasprave o novonastalim sajber pretnjama“, objasnio je Clairoux-Trépanier.
Prikupljanje podataka o prijetnjama korištenjem modela velikog jezika
LLM sistem je dobio instrukcije da sumira razgovore i kodira deset kritičnih CTI varijabli, kao što su identifikacija ciljanih organizacija, kritične infrastrukture i ranjivosti koje se mogu iskoristiti.
Dva ljudska kodera su zatim pažljivo pregledala svaki razgovor kako bi procijenila tačnost rezultata LLM-a.
Rezultati su bili odlični, sa LLM sistemom koji je postigao prosječnu skor tačnosti od 98%, u rasponu od 95% do 100% za deset varijabli. Ovaj nivo performansi je nadmašio očekivanja istraživača i naglašava ogroman potencijal LLM-a u oblasti obaveštajnih podataka o sajber pretnjama.
„Naši nalazi pokazuju da LLM mogu efikasno zamijeniti prvorazredne analitičare prijetnji u izvlačenju relevantnih informacija sa foruma o sajber kriminalu,“ izjavio je Beauchamp. “Ova tehnologija može značajno poboljšati efikasnost i skalabilnost CTI napora, omogućavajući organizacijama da ostanu korak ispred sajber prijetnji.”
Studija je takođe identifikovala oblasti za dalja poboljšanja, kao što je usavršavanje sposobnosti LLM-a da pravi razliku između istorijskih narativa i trenutnih događaja, kao i optimizacija napomena i tehnika grupisanja podataka. Uprkos ovim manjim ograničenjima, istraživači naglašavaju da je učinak LLM sistema uporediv sa performansama ljudskih analitičara.
Istraživači planiraju da nastave sa usavršavanjem LLM sistema i istraživanjem njegovih aplikacija u različitim domenima sajber bezbednosti. Oni također pozivaju na daljnja istraživanja korištenja najsavremenijih modela, kao što su Claude 3.5 Sonnet i GPT-4o, kako bi se pomjerile granice inteligencije cyber prijetnji vođene vještačkom inteligencijom.
Kako sajber prijetnje nastavljaju da se razvijaju i postaju sve sofisticiranije, integracija vještačke inteligencije i velikih jezičkih modela u strategije kibernetičke sigurnosti će promijeniti igru. Ova revolucionarna studija koju su sproveli Université de Montréal i Flare Systems otvara put novoj eri proaktivne sajber-sigurnosti vođene inteligencijom.
Izvor: CyberSecurityNews