Kas Snap saaks Interneti võltsuudiste eest päästa? Siin on ettevõtte salarelv

Vagelis PapalexakisUC Riverside

Kui Snapchat esmakordselt Stanfordi masinaehituse klassi osana esitleti, mõtles kursuse kohkunud õppejõu assistent avalikult, kas rakenduse loojad on loonud sekstirakenduse. Vähem kui kümme aastat hiljem võib Snapchat aidata lahendada üht suurimat praegu tehnoloogiaga seotud probleemi: peatada võltsuudiste levitamine Internetis.

Sisu

  • Võltsuudiste signaal?
  • Kassi-hiire mäng läbi aegade

Seda eesmärki silmas pidades on Snap Research – ettevõtte Snap, Inc. uurimisosakond. - annetas hiljuti raha California ülikooli Riverside'i projektile, mille eesmärk on leida uus viis võltsuudiste tuvastamiseks võrgus. The Algoritm UC Riverside on välja töötanud on väidetavalt võimeline tuvastama võltsuudiseid muljetavaldava, kuni 75-protsendilise täpsusega. Snapi toel loodavad nad seda veelgi parandada.

Soovitatud videod

"Nagu ma aru saan, on nad väga huvitatud sellest, kuidas seda probleemi mõista ja lõpuks lahendada."

"Snap ei ole üks esimesi ettevõtteid, kes [seda probleemi] silmas pidades meelde tuleb,"

Vagelis Papalexakis, UC Riverside'i arvutiteaduse ja -tehnika osakonna abiprofessor, rääkis Digital Trendsile. "Sellegipoolest on Snap sisuga tegelev ettevõte. Nagu ma aru saan, on nad väga huvitatud sellest, kuidas saaksime sellest probleemist aru saada ja lõpuks selle lahendada.

See, mis eristab UC Riverside'i uuringuid kümnetest, võib-olla isegi sadadest teistest teadusprojektidest, mis üritavad võltsuudiste tsüklit murda, on projekti ambitsioon. See ei ole lihtne märksõnade blokeerija, samuti ei ole selle eesmärk teatud URL-ide täielik keeld. Ja mis võib-olla kõige huvitavam, ei huvita teda eriti lugudes sisalduvad faktid. See eristab seda fakte kontrollivatest veebisaitidest, nagu Snopes, mis tuginevad tõelise automatiseerimise asemel inimese panusele ja hinnangule.

"Ma ei usalda tegelikult inimeste märkusi," ütles Papalexakis. "Mitte sellepärast, et ma inimesi ei usaldaks, kuid see on oma olemuselt raske probleem, millele lõplikku vastust saada. Meie motivatsioon tuleneb sellest, et küsime, kui palju me saame teha ainult andmeid vaadates ja kas saame kasutada võimalikult vähe inimlikke märkusi – kui üldse.

Võltsuudiste signaal?

Uus algoritm vaatab uudisest võimalikult palju "signaale" ja kasutab seda artikli usaldusväärsuse klassifitseerimiseks. Papalexakis ütles: "Kes jagas artiklit? Milliseid hashtage nad kasutasid? Kes selle kirjutas? Millisest uudisteorganisatsioonist see pärit on? Kuidas veebileht välja näeb? Püüame välja selgitada, millised tegurid [olulised] ja kui palju neil on mõju.

Näiteks räsimärk #LockHerUp ei pruugi tingimata kinnitada, et artikkel on iseenesest võltsuudis. Kui aga inimene lisab selle järelliide Twitteris artiklit jagades, võib see loole teatud kallakule viidata. Lisage neid vihjeid piisavalt kokku ja idee on see, et eraldi tükid moodustavad paljastava terviku. Teisisõnu öeldes, kui ta kõnnib nagu part ja vuliseb nagu part, on tõenäoline, et see on part. Või antud juhul kahlav, vulisev, alt-right vene pardi bot.

valeuudiste protest
snapchati toetav algoritm võitlus võltsuudiste protesti vastu getty2

"Meie huvi on mõista, mis juhtub varakult ja kuidas saame varajases staadiumis midagi märgistada, enne kui see võrku "nakatama" hakkab," jätkas Papalexakis. "See on praegu meie huvi: välja mõelda, mida konkreetse artikli sisust ja kontekstist välja pigistada."

Papalexakise rühma välja töötatud algoritm kasutab uudisteartiklite erinevate teabevoogude analüüsimiseks midagi, mida nimetatakse tensori lagunemiseks. Tensorid on mitmemõõtmelised kuubikud, mis on kasulikud paljude erinevate komponentidega andmete modelleerimiseks ja analüüsimiseks. Tensori dekomponeerimine võimaldab avastada andmetes mustreid, jagades tensori elementaarseteks teabeteks, mis esindavad konkreetset mustrit või teemat.

"Isegi naeruväärselt väike arv kommenteeritud artikleid võib viia meid tõesti väga kõrge täpsuseni"

Algoritm kasutab esmalt tensori lagunemist, et esitada andmeid nii, et see rühmitab võimalikud võltsuudised. Algoritmi teine ​​tasand ühendab seejärel artiklid, mida peetakse üksteise lähedal asuvateks. Nende artiklite vahelise seose kaardistamine tugineb põhimõttele, mida nimetatakse "süü tõttu assotsiatsioonist". mis viitab sellele, et kahe artikli vahelised ühendused on tõenäolisemalt sarnased ühega teine.

Pärast seda rakendatakse graafikutele masinõpet. See "pooljärelevalvega" lähenemisviis kasutab väikest arvu artikleid, mille kasutajad on kategoriseerinud, ja seejärel rakendab neid teadmisi palju suuremas andmekogumis. Kuigi see hõlmab mingil tasemel inimesi, hõlmab see vähem inimlikke märkusi kui enamik alternatiivseid meetodeid võimalike võltsuudiste klassifitseerimiseks. Teadlaste reklaamitud 75-protsendiline täpsus põhineb kahe avaliku andmekogumi korrektsel filtreerimisel ja 63 000 uudisteartikli täiendaval kogumisel.

"Isegi naeruväärselt väike arv kommenteeritud artikleid võib viia meid tõesti väga kõrge täpsuseni," ütles Papalexakis. "Palju kõrgem kui süsteem, kus püüdsime tabada üksikuid funktsioone, nagu lingvistika või muud asjad, mida inimesed võivad pidada valeinformatsiooniks."

Kassi-hiire mäng läbi aegade

Arvutiteaduse vaatenurgast on lihtne mõista, miks see töö meeldiks Vagelis Papalexakisele ja teistele UC Riverside'i teadlastele, aga ka Snapchati inimestele. Võimalus mitte ainult sorteerida võltsuudiseid tõelistest uudistest, vaid ka eristada kallutatud oppe tõsisest ajakirjandusest või satiirilistest artiklitest. Sibul on selline suurandmete mõistatus, millest insenerid unistavad.

Suurem küsimus on aga selles, kuidas seda algoritmi kasutatakse - ja kas see võib lõpuks aidata võltsuudiste nähtust maha suruda.

Snapi panus projekti (mis moodustab 7000 dollari suuruse "kingituse" ja täiendava mitterahalise toetuse) ei garanteeri, et ettevõte võtab selle tehnoloogia kasutusele kommertstootes. Kuid Papalexakis ütles, et loodab, et uuringud viivad lõpuks platvormile tehniliste ülekandmiseni.

Ta selgitas, et lõplik eesmärk on välja töötada süsteem, mis suudab anda igale artiklile usaldusväärsuse hinde. Teoreetiliselt saaks sellist skoori kasutada võltsuudiste välja filtreerimiseks, enne kui kasutajal on võimalus neile pilku heita.

See idee ei erine masinõppe e-posti rämpspostifiltritest, mis rakendavad ka hindamissüsteemi, mis põhineb sellistel teguritel nagu pildi ja teksti suhe sõnumi kehas. Papalexakis soovitas siiski, et eelistatav lähenemisviis võib olla lihtsalt kasutajate hoiatamine nendest lugusid, mis saavad võimaliku võltsingu kategoorias kõrgeid tulemusi – „ja seejärel las kasutaja otsustab, mida nendega teha seda.”

Üks hea põhjus on asjaolu, et uudised ei jagune alati nii täpselt rämpspostiks vs. singi kategooriad, nagu meil. Muidugi võivad mõned artiklid olla väljamõeldud, kuid teised võivad olla küsitavamad: ei sisalda otseseid valesid, kuid on siiski mõeldud lugejat ühes kindlas suunas juhtida. Nende artiklite eemaldamine, isegi kui leiame, et arvamused on meie omadega vastuolus, satub kleepuvamale territooriumile.

"See langeb halli alale," jätkas Papalexakis. "On hea, kui saame selle liigitada tugevalt kallutatud artikliks. Väärteabe jaoks on erinevad kategooriad. [Tugevalt kallutatud artikkel] ei pruugi olla nii halb kui otsene valeartikkel, kuid see müüb siiski lugejale teatud vaatenurga. See on nüansirikkam kui võlts vs. mitte võlts."

Lõppkokkuvõttes hoolimata Papalexakise soovist töötada välja süsteem, mis kasutab nii vähe järelevalvet kui võimalik, tunnistab ta, et see on väljakutse, mis peab hõlmama nii inimesi kui ka masinad.

"Ma näen seda tehnoloogilisest vaatenurgast kassi-hiire mänguna," ütles ta. „Ma ei arva, et ütlemine „selle lahendamine” on õige viis seda vaadata. Inimestele tööriista pakkumine, mis aitab neil artikliga seotud konkreetseid asju mõista, on osa lahendusest. See lahendus oleks tööriistad, mis aitavad teil asju ise hinnata, aktiivse kodanikuna harida, asjadest aru saada ja ridade vahelt lugeda. Ma ei usu, et sellele probleemile saab rakendada ainult tehnoloogilist lahendust, sest nii palju see sõltub inimestest ja sellest, kuidas nad asju näevad.

Toimetajate soovitused

  • Algoritm edestab inimesi võltsuudiste leidmisel