Voisiko Snap pelastaa Internetin valeuutisista? Tässä on yrityksen salainen ase

Vagelis PapalexakisUC Riverside

Kun Snapchat esiteltiin ensimmäisen kerran osana Stanfordin konetekniikan kurssia, kurssin kauhuissaan opettanut assistentti ihmetteli avoimesti, olivatko sovelluksen tekijät rakentaneet sekstointisovelluksen. Alle kymmenen vuotta myöhemmin Snapchat voisi auttaa ratkaisemaan yhden suurimmista tällä hetkellä tekniikan ongelmista: pysäyttämään "valeuutisten" leviäminen verkossa.

Sisällys

  • Signaali valeuutisille?
  • Kissa-hiiri-peli ikäisille

Tätä tavoitetta silmällä pitäen Snap Research – Snap, Inc: n tutkimusosasto. — lahjoitti äskettäin rahoitusta Kalifornian yliopiston Riverside-projektille, jonka tavoitteena on löytää uusi tapa havaita valeuutisia verkossa. The algoritmi UC Riverside on kehittänyt Sen kerrotaan pystyvän havaitsemaan valeuutisia vaikuttavalla, jopa 75 prosentin tarkkuudella. Snapin tuella he toivovat voivansa parantaa tätä edelleen.

Suositellut videot

"Ymmärtääkseni he ovat erittäin kiinnostuneita ymmärtämään, kuinka tämä ongelma voitaisiin ymmärtää - ja lopulta ratkaista se."

"Snap ei ole yksi ensimmäisistä yrityksistä, joka tulee mieleen [tämän ongelman] vuoksi", Vagelis Papalexakis, UC Riversiden tietojenkäsittelytieteen ja -tekniikan osaston apulaisprofessori, kertoi Digital Trendsille. "Snap on kuitenkin yritys, joka käsittelee sisältöä. Ymmärtääkseni he ovat hyvin kiinnostuneita ymmärtämään, kuinka tämä ongelma voitaisiin ymmärtää – ja lopulta ratkaista se.”

Se, mikä tekee UC Riversiden tutkimuksesta erilaisen kuin kymmenet, ehkä jopa sadat, muut tutkimusprojektit, jotka yrittävät katkaista valeuutisten kierteen, on hankkeen tavoite. Se ei ole yksinkertainen avainsanojen esto, eikä sen tarkoituksena ole asettaa yleinen kielto tietyille URL-osoitteille. Eikä ehkä mielenkiintoisinta se, että se ei ole erityisen kiinnostunut tarinoiden sisältämistä faktoista. Tämä erottaa sen tosiasiantarkistussivustoista, kuten Snopes, jotka luottavat ihmisen panokseen ja arviointiin todellisen automaation sijaan.

"En todellakaan luota inhimillisiin huomautuksiin", Papalexakis sanoi. "Ei siksi, ettenkö luottaisi ihmisiin, mutta siitä tuleminen on luonnostaan ​​vaikea ongelma saada lopullinen vastaus. Motivaatiomme tähän tulee siitä, että kysymme, kuinka paljon voimme tehdä tarkastelemalla tietoja yksin ja voimmeko käyttää mahdollisimman vähän inhimillisiä huomautuksia - jos ollenkaan."

Signaali valeuutisille?

Uusi algoritmi tarkastelee mahdollisimman monta "signaalia" uutisista ja yrittää sen avulla luokitella artikkelin luotettavuuden. Papalexakis sanoi: "Kuka jakoi artikkelin? Mitä hashtageja he käyttivät? Kuka kirjoitti sen? Mistä uutisjärjestöstä se on? Miltä verkkosivu näyttää? Yritämme selvittää, mitkä tekijät [merkittävät] ja kuinka paljon niillä on vaikutusta."

Esimerkiksi hashtag #LockHerUp ei välttämättä vahvista, että artikkeli itsessään on valeuutinen. Jos henkilö kuitenkin lisää tämän päätteen jakaessaan artikkelin Twitterissä, se voi viitata tarinaan tietyllä tavalla. Lisää näitä vihjeitä tarpeeksi yhteen, ja ideana on, että erilliset palaset muodostavat paljastavan kokonaisuuden. Toisin sanoen, jos se kävelee kuin ankka ja huusi kuin ankka, se on todennäköisesti ankka. Tai tässä tapauksessa kahlaava, huutava, alt-right venäläinen ankkabotti.

valeuutisten mielenosoitus
snapchatia tukeva algoritmi taistele valeuutisia vastaan ​​protesti getty2

"Meidän mielenkiinnon kohteena on ymmärtää, mitä tapahtuu varhaisessa vaiheessa ja kuinka voimme ilmoittaa jostain varhaisessa vaiheessa ennen kuin se alkaa "tartuttaa" verkkoa", Papalexakis jatkoi. "Se on meidän etumme tällä hetkellä: selvittää, mitä voimme puristaa irti tietyn artikkelin sisällöstä ja kontekstista."

Papalexakisin ryhmän kehittämä algoritmi käyttää jotain, jota kutsutaan tensorihajotelmaksi, analysoimaan uutisartikkelin eri tietovirtoja. Tensorit ovat moniulotteisia kuutioita, jotka ovat hyödyllisiä sellaisten tietojen mallintamiseen ja analysointiin, joissa on paljon erilaisia ​​komponentteja. Tensorihajotus mahdollistaa kuvioiden löytämisen tiedosta jakamalla tensorin alkeistietoihin, jotka edustavat tiettyä mallia tai aihetta.

"Jopa naurettavan pieni määrä selostettuja artikkeleita voi johtaa meidät todella, todella korkeaan tarkkuuteen"

Algoritmi käyttää ensin tensorihajotelmaa esittämään dataa siten, että se ryhmittelee yhteen mahdolliset valeuutiset. Algoritmin toinen taso yhdistää sitten artikkelit, joiden katsotaan olevan lähellä toisiaan. Näiden artikkeleiden välisen yhteyden kartoittaminen perustuu periaatteeseen, jota kutsutaan "syyllisyydeksi yhdistyksestä". viittaa siihen, että kahden artikkelin väliset yhteydet tarkoittavat, että ne ovat todennäköisemmin samanlaisia ​​kuin yksi toinen.

Tämän jälkeen kaavioihin sovelletaan koneoppimista. Tämä "puolivalvottu" lähestymistapa käyttää pientä määrää artikkeleita, jotka käyttäjät ovat luokitelleet, ja sitten soveltaa tätä tietoa paljon laajempaan tietojoukkoon. Vaikka tämä koskee edelleen ihmisiä jollain tasolla, se sisältää vähemmän inhimillisiä huomautuksia kuin useimmat vaihtoehtoiset menetelmät mahdollisten valeuutisten luokitteluun. Tutkijoiden mainostama 75 prosentin tarkkuustaso perustuu kahden julkisen tietojoukon ja 63 000 uutisartikkelin lisäkokoelmaan oikein suodattamiseen.

"Jopa naurettavan pieni määrä selitettyjä artikkeleita voi johtaa meidät todella, todella korkeaan tarkkuuteen", Papalexakis sanoi. "Paljon korkeampi kuin järjestelmä, jossa yritimme vangita yksittäisiä piirteitä, kuten kielitiedettä tai muita asioita, joita ihmiset saattavat pitää harhaanjohtavina."

Kissa-hiiri-peli ikäisille

Tietojenkäsittelytieteen näkökulmasta on helppo ymmärtää, miksi tämä työ vetoaa Vagelis Papalexakisiin ja muihin UC Riversiden tutkijoihin – sekä Snapchatin ihmisiin. Pystyä paitsi lajittelemaan valeuutisia oikeista uutisista, myös erottamaan puolueelliset julkaisut vakavasta journalismista tai satiiriset artikkelit Sipuli on sellainen suurdatan arvoitus, josta insinöörit haaveilevat.

Isompi kysymys on kuitenkin, kuinka tätä algoritmia käytetään - ja voiko se lopulta auttaa torjumaan valeuutisten ilmiötä.

Snapin panos projektiin (joka on 7 000 dollarin "lahja" ja ylimääräinen ei-taloudellinen tuki) ei takaa, että yritys ottaa teknologian käyttöön kaupallisessa tuotteessa. Mutta Papalexakis sanoi toivovansa tutkimuksen "johtavan lopulta teknologian siirtoon alustalle".

Lopullinen tavoite, hän selitti, on kehittää järjestelmä, joka pystyy tarjoamaan mille tahansa artikkelille luotettavuuspisteet. Teoriassa tällaista pistemäärää voitaisiin käyttää valeuutisten suodattamiseen ennen kuin käyttäjä ehtii edes nähdä sen.

Tämä ei ole erilainen idea kuin koneoppimisen sähköpostin roskapostisuodattimet, jotka myös käyttävät pisteytysjärjestelmää, joka perustuu tekijöihin, kuten kuvan ja tekstin suhde viestin rungossa. Papalexakis kuitenkin ehdotti, että parempi lähestymistapa voisi olla yksinkertaisesti käyttäjien varoittaminen niistä tarinoita, jotka saavat korkeat pisteet mahdollisten väärennösten kategoriassa – "ja anna sitten käyttäjän päättää, mitä tehdä se."

Yksi hyvä syy tähän on se, että uutiset eivät aina jakaannu niin siististi roskapostiin vs. kinkkuluokat, kuten sähköposti tekee. Tietyt artikkelit voivat toki olla läpikotaisin tehtyjä, mutta toiset voivat olla kyseenalaisempia: niissä ei ole suoria valheita, mutta niiden tarkoituksena on kuitenkin ohjata lukija tiettyyn suuntaan. Näiden artikkelien poistaminen, vaikka saattaisimmekin löytää mielipiteitämme ristiriidassa omien mielipiteidemme kanssa, joutuu tahmeampaan alueeseen.

"Tämä osuu harmaalle alueelle", Papalexakis jatkoi. "On hienoa, jos voimme luokitella tämän erittäin puolueelliseksi artikkeliksi. On olemassa erilaisia ​​luokkia sille, mitä voimme kutsua vääräksi tiedoksi. [Erittäin puolueellinen artikkeli] ei ehkä ole yhtä huono kuin suoranainen väärä artikkeli, mutta se myy lukijalle silti tietyn näkökulman. Se on vivahteikkaampi kuin fake vs. ei feikki."

Lopulta huolimatta Papalexakisin halusta kehittää järjestelmä, joka käyttää niin vähän valvontaa kuin mahdollista, hän myöntää, että tämä on haaste, jonka on koskettava sekä ihmisiä että koneita.

"Näen sen kissa-hiiri-pelinä teknisestä näkökulmasta", hän sanoi. "En usko, että sanonta "ratkaiseminen" on oikea tapa tarkastella sitä. Osa ratkaisua on tarjota ihmisille työkalu, joka voi auttaa heitä ymmärtämään tiettyjä asioita artikkelista. Tämä ratkaisu olisi työkaluja, joiden avulla voit arvioida asioita itse, pysyä koulutettuna aktiivisena kansalaisena, ymmärtää asioita ja lukea rivien välistä. En usko, että tähän ongelmaan voidaan soveltaa pelkästään teknologista ratkaisua, koska se riippuu niin paljon ihmisistä ja siitä, miten he näkevät asiat."

Toimittajien suositukset

  • Algoritmi toimii paremmin kuin ihmiset havaitessaan valeuutisia