More

    DarkBERT: Dark Web umjetna inteligencija

    Južnokorejski istraživači (Youngjin Jin, Eugene Jang, Jian Cui, Jin-Woo Chung, Yongjae Lee, Seungwon Shin) sa KAIST-a (Korea Advanced Institute of Science & Technology) razvili su DarkBERT.

    Dark web” je nedostupan i skriven segment interneta, poznat po svojim anonimnim web stranicama i ilegalnim tržištima koja olakšavaju aktivnosti poput ilegalne trgovine, kršenja podataka i kibernetičkog kriminala.

    Ovaj AI model se upustio u dubine dark web-a, anonimnog i skrivenog dijela interneta, kako bi indeksirao i prikupio informacije iz njegovih najsjajnijih domena.

    ‘Dark Web’ se oslanja na sofistikovane metode za skrivanje korisničkih identiteta, što otežava praćenje njihovih aktivnosti na mreži. Tor je omiljeni softver za pristup istom, koji svakodnevno koriste milioni.

    DarkBERT, izgrađen na arhitekturi RoBERTa, doživio je preporod jer su istraživači otkrili neiskorišteni potencijal performansi zbog njegove početne nedovoljne obuke, što je dovelo do poboljšane efikasnosti iznad njegovih mogućnosti iz 2019. godine.

    Istraživači istražuju kako veliki jezički modeli (LLM) poput ChatGPT-a mogu da se bore protiv kibernetičkog kriminala tako što će iskoristiti moć vještačke inteligencije za borbu vatrom protiv vatre.

    Imajući ovaj cilj na umu, istraživači su otkrili svoja otkrića u publikaciji pod naslovom “DarkBERT: Illuminating the Language Model’s Exploration of the Dark Web”. Prikupili su neobrađene informacije integracijom svog modela sa Tor mrežom, formirajući sveobuhvatnu bazu podataka.

    Nalazi procjene istraživača pokazuju superiornost modela klasifikacije zasnovanog na DarkBERT-u u poređenju sa uspostavljenim unapred obučenim jezičkim modelima.

    Tim kaže da DarkBERT ima potencijal za različite aplikacije za kibernetičku bezbjednost, uključujući identifikaciju web stranica uključenih u prodaju ransomware-a ili neovlašteno otkrivanje osjetljivih informacija.

    Osim toga, DarkBERT može proći kroz različite dark web forume, koji se svakodnevno ažuriraju, omogućavajući budno praćenje nezakonite razmjene informacija.

    Slučajevi upotrebe u domenu kibernetičke bezbjednosti

    Ispod su navedeni svi slučajevi upotrebe u domeni kibernetičke bezbjednosti:

    Etička razmatranja i ograničenja

    Interesantna su nam sledeća etička razmatranja:

    • Puzanje po Dark Web-u
    • Maskiranje osjetljivih informacija
    • Etički komentari
    • Upotreba javnih skupova podataka Dark Web-a

    Ograničenja su sledeća:

    • Ograničena upotreba za zadatke koji nisu engleski
    • Ovisnost o podacima specifičnim za zadatak

    Pretražujući Dark Web koristeći anonimizujući firewall mreže Tor i filtrirajući prikupljene podatke tehnikama kao što su deduplikacija, balansiranje kategorija i prethodna obrada podataka, istraživači su kreirali Dark Web bazu podataka, koja je potom korištena za obuku DarkBERT-a.

    Iako DarkBERT, poput drugih velikih jezičkih modela (LLM), nije gotov proizvod, stalna obuka i usavršavanje mogu poboljšati njegove performanse, a njegove specifične primjene i potencijalni uvidi tek treba u potpunosti istražiti.

    DarkBERT demonstrira potencijal za buduća istraživanja u oblasti Dark Web-a i industrije kibernetičke bezbjednosti. Planira da poboljša svoje performanse korišćenjem novije arhitekture, proširenjem prikupljanja podataka i razvojem višejezičnog modela jezika specifičnog za Dark Web domen.

    Izvor: Cyber Security News

    Recent Articles

    spot_img

    Related Stories