Keď bol Snapchat prvýkrát predstavený ako súčasť strojárskej triedy na Stanforde, zdesený učiteľ kurzu sa otvorene pýtal, či tvorcovia aplikácie vytvorili aplikáciu na sexting. O menej ako desať rokov neskôr by Snapchat mohol pomôcť vyriešiť jeden z najväčších problémov, ktorým v súčasnosti čelí technológia: zastavenie šírenie „falošných správ“ online.
Obsah
- Signál pre falošné správy?
- Hra na mačku a myš pre veky
S týmto cieľom Snap Research – výskumná divízia spoločnosti Snap, Inc. — nedávno venovala finančné prostriedky projektu Kalifornskej univerzity v Riverside s cieľom nájsť nový spôsob odhaľovania falošných správ online. The bol vyvinutý algoritmus UC Riverside je údajne schopný odhaliť falošné správy s pôsobivou úrovňou presnosti až 75 percent. S podporou Snapu dúfajú, že to ešte vylepšia.
Odporúčané videá
"Ako tomu rozumiem, majú veľký záujem o to, aby dobre pochopili, ako možno tento problém pochopiť - a nakoniec ho vyriešiť."
„Snap nie je jednou z prvých spoločností, ktorá by vám napadla vzhľadom na [tento problém],“
Vagelis Papalexakis, odborný asistent na oddelení počítačovej vedy a inžinierstva na UC Riverside, povedal pre Digital Trends. „Napriek tomu je Snap spoločnosť, ktorá spracováva obsah. Ako tomu rozumiem, majú veľký záujem o to, aby dobre pochopili, ako by sa dalo tomuto problému porozumieť – a nakoniec ho vyriešiť.“To, čo odlišuje výskum UC Riverside od desiatok, možno dokonca stoviek iných výskumných projektov, ktoré sa snažia prelomiť cyklus falošných správ, je ambícia projektu. Nie je to jednoduchý blokovač kľúčových slov a ani jeho cieľom nie je zakázať určité adresy URL. A čo je možno najzaujímavejšie, nezaujímajú ho najmä fakty obsiahnuté v príbehoch. To ho odlišuje od webových stránok na kontrolu faktov, ako je Snopes, ktoré sa namiesto skutočnej automatizácie spoliehajú na ľudský vstup a hodnotenie.
"Naozaj neverím ľudským anotáciám," povedal Papalexakis. „Nie preto, že by som neveril ľuďom, ale toto je už zo svojej podstaty ťažký problém, na ktorý treba dostať definitívnu odpoveď. Naša motivácia vychádza z toho, že sa pýtame, koľko môžeme urobiť pohľadom na údaje samotné a či môžeme použiť čo najmenej ľudských anotácií – ak vôbec nejaké.“
Signál pre falošné správy?
Nový algoritmus sa pozerá na čo najviac „signálov“ z novinového príbehu a používa to na to, aby sa pokúsil klasifikovať dôveryhodnosť článku. Papalexakis povedal: „Kto zdieľal článok? Aké hashtagy používali? kto to napísal? Od ktorej spravodajskej organizácie pochádza? Ako vyzerá webová stránka? Snažíme sa zistiť, na ktorých faktoroch [záleží] a aký veľký vplyv majú.“
Napríklad hashtag #LockHerUp sám o sebe nemusí nevyhnutne potvrdiť, že článok je falošná správa. Ak však niekto pridá túto príponu pri zdieľaní článku na Twitteri, môže to naznačovať určitý sklon k príbehu. Pridajte dostatok týchto indícií dohromady a myšlienkou je, že jednotlivé časti tvoria odhaľujúci celok. Inak povedané, ak chodí ako kačica a kváka ako kačica, je pravdepodobné, že je to kačica. Alebo v tomto prípade kolískajúci, kvákajúci, alt-right ruský kačací bot.
„Naším záujmom je porozumieť tomu, čo sa stane na začiatku a ako môžeme niečo naznačiť v počiatočných fázach predtým, ako to začne ‚infikovať‘ sieť,“ pokračoval Papalexakis. "To je momentálne náš záujem: zistiť, čo môžeme vytlačiť z obsahu a kontextu konkrétneho článku."
Algoritmus vyvinutý skupinou Papalexakis používa niečo, čo sa nazýva rozklad tenzora na analýzu rôznych tokov informácií o spravodajskom článku. Tenzory sú viacrozmerné kocky, užitočné na modelovanie a analýzu údajov, ktoré majú veľa rôznych komponentov. Dekompozícia tenzora umožňuje objaviť vzory v údajoch rozdelením tenzora na elementárne informácie, ktoré predstavujú konkrétny vzor alebo tému.
„Dokonca aj smiešne malý počet anotovaných článkov nás môže viesť k skutočne, skutočne vysokej úrovni presnosti“
Algoritmus najprv používa rozklad tenzorov na reprezentáciu údajov takým spôsobom, že zoskupuje možné falošné správy. Druhá vrstva algoritmu potom spája články, ktoré sa považujú za blízko seba. Mapovanie spojenia medzi týmito článkami sa opiera o princíp nazývaný „vina z asociácie“, naznačuje, že spojenia medzi dvoma článkami znamenajú, že je väčšia pravdepodobnosť, že budú podobné jednému ďalší.
Potom sa na grafy aplikuje strojové učenie. Tento „polodozorný“ prístup využíva malý počet článkov, ktoré používatelia kategorizovali, a potom tieto poznatky aplikuje na oveľa väčší súbor údajov. Aj keď sa to na určitej úrovni stále týka ľudí, zahŕňa to menej ľudskej anotácie ako väčšina alternatívnych metód klasifikácie potenciálnych falošných správ. 75-percentná úroveň presnosti, ktorú výskumníci ponúkajú, je založená na správnom filtrovaní dvoch verejných súborov údajov a ďalšej kolekcii 63 000 spravodajských článkov.
"Dokonca aj smiešne malý počet anotovaných článkov nás môže viesť k skutočne, skutočne vysokej úrovni presnosti," povedal Papalexakis. "Oveľa vyššie ako systém, v ktorom sme sa snažili zachytiť jednotlivé črty, ako je lingvistika, alebo iné veci, ktoré môžu ľudia považovať za dezinformačné."
Hra na mačku a myš pre veky
Z hľadiska počítačovej vedy je ľahké pochopiť, prečo by táto práca oslovila Vagelisa Papalexakisa a ďalších výskumníkov z UC Riverside – ako aj ľudí zo Snapchatu. Byť schopný nielen triediť falošné správy od skutočných správ, ale aj odlíšiť zaujaté op-eds od serióznej žurnalistiky alebo satirické články od Cibuľa je typom veľkých dátových hlavolamov, o ktorých inžinieri snívajú.
Väčšou otázkou však je, ako sa tento algoritmus použije – a či môže v konečnom dôsledku pomôcť potlačiť fenomén falošných správ.
Príspevok spoločnosti Snap do projektu (ktorý predstavuje „darček“ 7 000 USD a dodatočnú nefinančnú podporu) nezaručuje, že spoločnosť prijme technológiu do komerčného produktu. Papalexakis však povedal, že dúfa, že výskum nakoniec „povedie k nejakému prenosu technológií na platformu“.
Konečným cieľom, vysvetlil, je vyvinúť systém, ktorý je schopný poskytnúť každému článku skóre dôveryhodnosti. Teoreticky by sa takéto skóre mohlo použiť na odfiltrovanie falošných správ ešte predtým, ako ich používateľ vôbec zahliadne.
Ide o nápad, ktorý sa nelíši od filtrov nevyžiadanej pošty strojového učenia, ktoré tiež používajú systém hodnotenia založený na faktoroch, ako je pomer obrázka k textu v tele správy. Papalexakis však navrhol, že preferovaným prístupom by mohlo byť jednoducho upozorniť používateľov na ne príbehy, ktoré majú vysoké skóre v kategórii možných falošných — „a potom nech sa používateľ rozhodne, čo s tým urobí to.”
Jedným z dobrých dôvodov je skutočnosť, že správy sa nie vždy tak prehľadne rozdeľujú na spam vs. kategórie šunky, ako to robí e-mail. Iste, niektoré články môžu byť výmyslom, ale iné môžu byť spornejšie: neobsahujú žiadne priame lži, no napriek tomu majú za cieľ naviesť čitateľa jedným istým smerom. Odstránenie týchto článkov, aj keď by sme mohli nájsť názory, ktoré sú v rozpore s našimi vlastnými, sa dostáva do lepšej oblasti.
"Toto spadá do šedej oblasti," pokračoval Papalexakis. „Je v poriadku, ak to môžeme kategorizovať ako silne neobjektívny článok. Existujú rôzne kategórie pre to, čo by sme mohli nazvať dezinformácie. [Výrazne zaujatý článok] nemusí byť taký zlý ako priamočiary nepravdivý článok, no stále ponúka čitateľovi konkrétny názor. Je to jemnejšie ako falošné vs. nie falošné."
V konečnom dôsledku, napriek Papalexakisovej túžbe prísť so systémom, ktorý využíva tak malý dohľad ako Je to možné, uznáva, že ide o výzvu, ktorá bude musieť zahŕňať tak ľudí, ako aj stroje.
"Vnímam to ako hru na mačku a myš z technologického hľadiska," povedal. „Nemyslím si, že povedať „vyriešiť to“ je správny spôsob, ako sa na to pozerať. Súčasťou riešenia je poskytnúť ľuďom nástroj, ktorý im môže pomôcť pochopiť konkrétne veci o článku. Toto riešenie by boli nástroje, ktoré vám môžu pomôcť posúdiť veci sami, zostať vzdelaným ako aktívny občan, pochopiť veci a čítať medzi riadkami. Nemyslím si, že na tento problém možno použiť iba technologické riešenie, pretože veľa závisí od ľudí a od toho, ako veci vidia.“
Odporúčania redaktorov
- Algoritmus prekonáva ľudí pri rozpoznávaní falošných správ