
Kad Snapchat pirmo reizi tika prezentēts kā daļa no Stenfordas mašīnbūves nodarbībām, kursa šausminošais pasniedzēja asistents atklāti domāja, vai lietotnes veidotāji ir izveidojuši sekstinga lietotni. Mazāk nekā desmit gadus vēlāk Snapchat varētu palīdzēt atrisināt vienu no lielākajām problēmām, ar ko pašlaik saskaras tehnoloģija: apturēt “viltus ziņu” izplatīšana tiešsaistē.
Saturs
- Signāls viltus ziņām?
- Kaķa un peles spēle vecumam
Paturot prātā šo mērķi, Snap Research — Snap, Inc. pētniecības nodaļa. — nesen ziedoja finansējumu Kalifornijas Universitātes Riversaidas projektam, kura mērķis ir atrast jaunu veidu, kā tiešsaistē atklāt viltus ziņu stāstus. The UC Riverside izstrādātais algoritms tiek ziņots, ka spēj atklāt viltus ziņu stāstus ar iespaidīgu precizitātes līmeni līdz 75 procentiem. Ar Snap atbalstu viņi cer to vēl vairāk uzlabot.
Ieteiktie videoklipi
"Kā es saprotu, viņi ir ļoti ieinteresēti labi saprast, kā varētu saprast šo problēmu un galu galā to atrisināt."
"Snap nav viens no pirmajiem uzņēmumiem, kas ienāks prātā, ņemot vērā [šo problēmu]," Vagelis Papalexakis, UC Riversaidas Datorzinātņu un inženierzinātņu nodaļas docents, pastāstīja Digital Trends. "Tomēr Snap ir uzņēmums, kas apstrādā saturu. Kā es saprotu, viņi ir ļoti ieinteresēti labi izprast, kā varētu saprast šo problēmu un galu galā to atrisināt.
Tas, kas padara UC Riverside pētījumu atšķirīgu no desmitiem, varbūt pat simtiem citu pētniecības projektu, kas mēģina pārtraukt viltus ziņu ciklu, ir projekta ambīcijas. Tas nav vienkāršs atslēgvārdu bloķētājs, un tā mērķis nav arī vispārējs aizliegums noteiktiem URL. Un, iespējams, pats interesantākais, to īpaši neinteresē stāstos ietvertie fakti. Tas atšķir to no faktu pārbaudes vietnēm, piemēram, Snopes, kas paļaujas uz cilvēka ieguldījumu un novērtējumu, nevis patiesu automatizāciju.
"Es īsti neuzticos cilvēku anotācijām," sacīja Papalexakis. "Ne tāpēc, ka es neuzticos cilvēkiem, bet kļūt par to ir pēc būtības grūta problēma, uz kuru iegūt galīgu atbildi. Mūsu motivācija tam izriet no jautājuma, cik daudz mēs varam paveikt, aplūkojot tikai datus, un vai mēs varam izmantot pēc iespējas mazāk cilvēku anotāciju — ja vispār ir.
Signāls viltus ziņām?
Jaunais algoritms ņem vērā pēc iespējas vairāk “signālu” no ziņu stāsta un izmanto to, lai mēģinātu klasificēt raksta uzticamību. Papalexakis teica: “Kas dalījās ar rakstu? Kādus hashtags viņi izmantoja? Kurš to uzrakstīja? No kuras ziņu organizācijas tas ir? Kā izskatās tīmekļa lapa? Mēs cenšamies noskaidrot, kuri faktori [svarīgi] un cik liela ietekme tiem ir.
Piemēram, tēmturis #LockHerUp ne vienmēr apstiprina, ka raksts pats par sevi ir viltus ziņas. Tomēr, ja persona pievieno šo sufiksu, kopīgojot rakstu vietnē Twitter, tas var likt domāt par zināmu stāsta slīpumu. Pievienojiet pietiekami daudz šo norādes kopā, un ideja ir tāda, ka atsevišķie gabali veido atklājošu veselumu. Citiem vārdiem sakot, ja tā staigā kā pīle un čīkst kā pīle, iespējams, ka tā ir pīle. Vai, šajā gadījumā, vāļājošs, čīkstošs, alt-right krievu pīļu bots.


"Mūsu intereses ir saprast, kas notiek agrīnā stadijā un kā mēs varam kaut ko atzīmēt agrīnā stadijā, pirms tas sāk "inficēt" tīklu," turpināja Papalexakis. "Pagaidām tās ir mūsu intereses: izstrādāt to, ko mēs varam izspiest no konkrēta raksta satura un konteksta."
Papalexakis grupas izstrādātais algoritms izmanto to, ko sauc par tenzoru sadalīšanu, lai analizētu dažādas informācijas plūsmas par ziņu rakstu. Tensori ir daudzdimensiju kubi, kas ir noderīgi, lai modelētu un analizētu datus, kuriem ir daudz dažādu komponentu. Tenzoru sadalīšana ļauj atklāt datos modeļus, sadalot tenzoru elementārās informācijas daļās, kas attēlo noteiktu modeli vai tēmu.
"Pat smieklīgi mazs anotētu rakstu skaits var mūs novest pie patiešām, ļoti augsta precizitātes līmeņa"
Algoritms vispirms izmanto tenzoru sadalīšanu, lai attēlotu datus tādā veidā, ka tas grupē iespējamos viltus ziņu stāstus. Otrais algoritma līmenis pēc tam savieno rakstus, kas tiek uzskatīti par tuvu viens otram. Saiknes kartēšana starp šiem pantiem balstās uz principu, ko sauc par “vainīgumu asociācijas dēļ”. liek domāt, ka savienojumi starp diviem rakstiem, visticamāk, ir līdzīgi vienam cits.
Pēc tam grafikiem tiek piemērota mašīnmācīšanās. Šī “daļēji uzraudzītā” pieeja izmanto nelielu skaitu rakstu, kurus lietotāji ir iedalījuši kategorijās, un pēc tam izmanto šīs zināšanas daudz lielākai datu kopai. Lai gan tas zināmā mērā joprojām attiecas uz cilvēkiem, tas ietver mazāk cilvēku anotāciju nekā vairums alternatīvo iespējamo viltus ziņu klasifikācijas metožu. Pētnieku norādītais 75 procentu precizitātes līmenis ir balstīts uz pareizu divu publisko datu kopu filtrēšanu un papildu 63 000 ziņu rakstu kolekciju.
"Pat smieklīgi mazs anotētu rakstu skaits var mūs novest pie patiešām ļoti augsta precizitātes līmeņa," sacīja Papalexakis. "Daudz augstāka nekā tāda sistēma, kurā mēs mēģinājām uztvert atsevišķas iezīmes, piemēram, valodniecību vai citas lietas, kuras cilvēki var uzskatīt par dezinformatīvām."
Kaķa un peles spēle vecumam
No datorzinātņu viedokļa ir viegli saprast, kāpēc šis darbs patiktu Vagelim Papalexakis un citiem pētniekiem UC Riverside, kā arī Snapchat darbiniekiem. Spēja ne tikai šķirot viltus ziņas no īstām ziņām, bet arī atšķirt neobjektīvus izdevumus no nopietnas žurnālistikas vai satīriskus rakstus. Sīpols ir tāda veida lielo datu mīkla, par ko sapņo inženieri.
Tomēr lielāks jautājums ir par to, kā šis algoritms tiks izmantots un vai tas galu galā var palīdzēt apkarot viltus ziņu fenomenu.
Snap ieguldījums projektā (kas ir USD 7000 "dāvana" un papildu nefinansiāls atbalsts) negarantē, ka uzņēmums izmantos tehnoloģiju komerciālā produktā. Bet Papalexakis sacīja, ka cer, ka pētījums galu galā "novestu pie zināmas tehnoloģiju pārejas uz platformu".

Viņš paskaidroja, ka iespējamais mērķis ir izstrādāt sistēmu, kas spēj nodrošināt jebkuru rakstu ar uzticamības rādītāju. Teorētiski šādu punktu skaitu varētu izmantot, lai filtrētu viltus ziņas, pirms lietotājs to pat pamana.
Šī ideja nav līdzīga mašīnmācīšanās e-pasta surogātpasta filtriem, kas arī izmanto vērtēšanas sistēmu, kuras pamatā ir tādi faktori kā attēla un teksta attiecība ziņojuma pamattekstā. Tomēr Papalexakis ierosināja, ka vēlamā pieeja varētu būt vienkārši lietotāju brīdināšana par tiem stāsti, kas iegūst augstu rezultātu iespējamo viltojumu kategorijā — “un pēc tam ļaujiet lietotājam izlemt, ar ko rīkoties to.”
Viens labs iemesls tam ir fakts, ka ziņas ne vienmēr tik precīzi sadalās surogātpasta un surogātpasta ziņā. šķiņķa kategorijas, kā to dara e-pasts. Protams, daži raksti var būt izdomāti, bet citi var būt apšaubāmāki: tajos nav tiešu melu, taču tie ir paredzēti lasītāja virzīšanai vienā noteiktā virzienā. Noņemot šos rakstus, pat ja mēs varam atrast viedokļus, kas nesaskan ar mūsu pašu viedokļiem, nonāk pielipīgākā teritorijā.
"Tas iekrīt pelēkajā zonā," turpināja Papalexakis. “Ir labi, ja mēs varam to klasificēt kā ļoti neobjektīvu rakstu. Ir dažādas kategorijas, ko mēs varētu saukt par dezinformāciju. [Ļoti neobjektīvs raksts] var nebūt tik slikts kā tiešu nepatiess raksts, taču tas lasītājam joprojām pārdod noteiktu viedokli. Tas ir vairāk niansēts nekā viltots vs. nav viltots."
Galu galā, neskatoties uz Papalexakis vēlmi izstrādāt sistēmu, kas izmanto tik maz uzraudzības kā iespējams, viņš atzīst, ka tas ir izaicinājums, kurā būs jāiekļauj gan cilvēki, gan mašīnas.
"Es to uztveru kā kaķa un peles spēli no tehnoloģiskā viedokļa," viņš teica. "Es nedomāju, ka teiciens" to atrisināt" ir pareizais veids, kā uz to skatīties. Cilvēku nodrošināšana ar rīku, kas var palīdzēt viņiem saprast konkrētas lietas par rakstu, ir daļa no risinājuma. Šis risinājums būtu rīki, kas var palīdzēt jums pašiem spriest par lietām, palikt izglītotam kā aktīvam pilsonim, saprast lietas un lasīt starp rindiņām. Es nedomāju, ka šai problēmai var piemērot tikai tehnoloģisku risinājumu, jo liela daļa no tās ir atkarīga no cilvēkiem un no tā, kā viņi redz lietas.
Redaktoru ieteikumi
- Algoritms pārspēj cilvēkus, atklājot viltus ziņas