Megmentheti a Snap az internetet az álhírektől? Íme a cég titkos fegyvere

Vagelis PapalexakisUC Riverside

Amikor a Snapchat először bemutatásra került egy stanfordi gépészmérnöki kurzus részeként, a kurzus rémült tanársegédje nyíltan azon töprengett, vajon az alkalmazás készítői építettek-e szextingalkalmazást. Kevesebb mint egy évtizeddel később a Snapchat segíthet megoldani az egyik legnagyobb technológiai problémát: megállítani a az „álhírek” online terjedése.

Tartalom

  • Az álhírek jele?
  • Egy macska-egér játék korosztály számára

Ezt a célt szem előtt tartva a Snap Research – a Snap, Inc. kutatási részlege. – a közelmúltban támogatást adományozott a Kaliforniai Egyetem Riverside projektjének, amelynek célja, hogy új módszert találjon az álhírek online észlelésére. A Az UC Riverside algoritmust fejlesztette ki állítólag képes észlelni az álhíreket lenyűgöző, akár 75 százalékos pontossággal. A Snap támogatásával remélik, hogy tovább javíthatják ezt.

Ajánlott videók

„Ahogy én megértem, nagyon érdekli őket, hogy jól megértsék, hogyan lehet megérteni ezt a problémát – és végül megoldani.”

„A Snap nem az első cégek közé tartozik, amelyek eszébe jutnak [ez a probléma]” Vagelis Papalexakis, a UC Riverside számítástechnikai és mérnöki osztályának adjunktusa mondta a Digital Trendsnek. „Mindazonáltal a Snap egy olyan cég, amely tartalmat kezel. Ha jól értem, nagyon érdekli őket, hogy jól megértsék, hogyan lehet megérteni ezt a problémát – és végül megoldani.”

Ami az UC Riverside kutatását különbözteti meg a több tucat, esetleg több száz más kutatási projekttől, amelyek megpróbálják megtörni az álhírek ciklusát, az a projekt ambíciója. Ez nem egy egyszerű kulcsszóblokkoló, és nem is célja bizonyos URL-ek általános tiltása. És ami talán a legérdekesebb, nem is különösebben érdeklik a történetekben foglalt tények. Ez különbözteti meg az olyan tényellenőrző webhelyektől, mint a Snopes, amelyek a valódi automatizálás helyett emberi közreműködésre és értékelésre támaszkodnak.

„Nem igazán bízom az emberi megjegyzésekben” – mondta Papalexakis. „Nem azért, mert nem bízom az emberekben, de ez egy eredendően nehéz probléma, amelyre határozott választ kell kapni. A motivációnk az, hogy megkérdezzük, mennyit tehetünk, ha csak az adatokat nézzük, és hogy a lehető legkevesebb emberi megjegyzést használhatjuk-e – ha egyáltalán van ilyen.”

Az álhírek jele?

Az új algoritmus a lehető legtöbb „jelet” megvizsgálja egy hírből, és ezt használja a cikk megbízhatóságának osztályozására. Papalexakis azt mondta: „Ki osztotta meg a cikket? Milyen hashtageket használtak? Ki írta ezt? Melyik hírszervezettől származik? Hogyan néz ki a weboldal? Megpróbáljuk kitalálni, hogy mely tényezők [számítanak], és mekkora befolyásuk van.”

Például a #LockHerUp hashtag nem feltétlenül erősíti meg, hogy egy cikk önmagában álhír. Ha azonban valaki hozzáadja ezt az utótagot, amikor megoszt egy cikket a Twitteren, az bizonyos szöget sugallhat a történetben. Ha ezeket a nyomokat adjuk össze, akkor az ötlet az, hogy a különálló darabok feltáró egészet alkotnak. Más szóval, ha úgy jár, mint egy kacsa, és hápog, mint egy kacsa, akkor nagy eséllyel kacsa. Vagy ebben az esetben egy kacsázó, hápogó, alt-jobb orosz kacsabot.

álhírek tiltakozása
snapchat támogató algoritmus harc álhír tiltakozás getty2

„Az az érdekünk, hogy megértsük, mi történik korán, és hogyan jelezhetünk valamit a korai szakaszban, mielőtt az elkezdené „megfertőzni” a hálózatot” – folytatta Papalexakis. "Egyelőre ez az érdekünk: kidolgozni, mit tudunk kisajtolni egy adott cikk tartalmából és kontextusából."

A Papalexakis csoportja által kifejlesztett algoritmus az úgynevezett tenzordekompozíciót használja a hírcikkekkel kapcsolatos különféle információáramok elemzésére. A tenzorok többdimenziós kockák, amelyek sok különböző komponensből álló adatok modellezésére és elemzésére szolgálnak. A tenzorbontás lehetővé teszi az adatok mintáinak felfedezését azáltal, hogy a tenzort elemi információkra bontja, amelyek egy adott mintát vagy témát képviselnek.

„Még nevetségesen kis számú kommentárral ellátott cikk is igazán, nagyon magas szintű pontossághoz vezethet”

Az algoritmus először tenzorbontást használ az adatok oly módon történő megjelenítésére, hogy az esetleges álhíreket csoportosítsa. Az algoritmus második szintje ezután összekapcsolja azokat a cikkeket, amelyek egymáshoz közelinek tekinthetők. E cikkek közötti kapcsolat feltérképezése a „társulás általi bűnösség” elvre támaszkodik. azt sugallja, hogy a két cikk közötti kapcsolatok azt jelentik, hogy nagyobb valószínűséggel hasonlítanak egyhez egy másik.

Ezt követően gépi tanulást alkalmazunk a grafikonokon. Ez a „félig felügyelt” megközelítés kis számú cikket használ, amelyeket a felhasználók kategorizáltak, majd ezt a tudást egy sokkal nagyobb adathalmazra alkalmazza. Bár ez bizonyos szinten még mindig érinti az embereket, kevesebb emberi annotációt igényel, mint a lehetséges álhírek osztályozásának legtöbb alternatív módszere. A kutatók által hirdetett 75 százalékos pontossági szint két nyilvános adathalmaz és egy további 63 000 cikkből álló gyűjtemény helyes szűrésén alapul.

"Még nevetségesen kis számú kommentárral ellátott cikk is igazán, nagyon magas szintű pontossághoz vezethet" - mondta Papalexakis. "Sokkal magasabb, mint egy olyan rendszernél, ahol megpróbáltuk megragadni az egyéni jellemzőket, például a nyelvészetet, vagy más dolgokat, amelyeket az emberek félreinformatívnak tekintenek."

Egy macska-egér játék korosztály számára

Számítástechnikai szempontból könnyen belátható, hogy ez a munka miért vonzó Vagelis Papalexakisnak és a UC Riverside többi kutatójának – valamint a Snapchat munkatársainak. Képes nemcsak az álhíreket a valódi hírektől szétválogatni, hanem megkülönböztetni az elfogult cikkeket a komoly újságírástól vagy a szatirikus cikkeket A hagyma ez az a fajta big data rejtvény, amiről a mérnökök álmodoznak.

A nagyobb kérdés azonban az, hogy ezt az algoritmust hogyan fogják használni – és hogy végül segíthet-e az álhírek jelenségének visszaszorításában.

A Snap hozzájárulása a projekthez (amely 7000 dolláros „ajándékot” és további nem pénzügyi támogatást jelent) nem garantálja, hogy a vállalat kereskedelmi termékben alkalmazza a technológiát. De Papalexakis azt mondta, reméli, hogy a kutatás végül „elvezet a technológiai átadáshoz a platformra”.

A végső cél – magyarázta – egy olyan rendszer kifejlesztése, amely képes bármely cikknek megbízhatósági pontszámmal ellátni. Elméletileg egy ilyen pontszámot fel lehetne használni az álhírek kiszűrésére, még mielőtt a felhasználó rápillanthatna.

Ez az ötlet nem különbözik a gépi tanulási e-mail spamszűrőktől, amelyek olyan tényezőkön alapuló pontozási rendszert is alkalmaznak, mint például a kép és a szöveg aránya az üzenet törzsében. Papalexakis azonban azt javasolta, hogy az előnyben részesített megközelítés egyszerűen csak figyelmezteti a felhasználókat ezekre történetek, amelyek magas pontszámot érnek el a lehetséges hamisítás kategóriában – „majd hagyja, hogy a felhasználó döntse el, mit kezdjen vele azt."

Ennek egyik jó oka az a tény, hogy a hírek nem mindig oszlanak meg olyan szépen a spam vs. sonka kategóriákban, ahogy az email is teszi. Persze lehet, hogy egyes cikkek kitalált, mások azonban megkérdőjelezhetőbbek: nem tartalmaznak közvetlen hazugságokat, de mégis egy bizonyos irányba akarják elvezetni az olvasót. Ezeknek a cikkeknek az eltávolítása még akkor is ragadósabb területre kerül, ha találkozhatunk a saját véleményünkkel.

„Ez egy szürke területre esik” – folytatta Papalexakis. „Rendben van, ha ezt az erősen elfogult cikkek közé sorolhatjuk. Különböző kategóriák léteznek annak, amit félretájékoztatásnak nevezhetünk. [Egy erősen elfogult cikk] lehet, hogy nem olyan rossz, mint egy egyenesen hamis cikk, de mégis elad egy bizonyos nézőpontot az olvasónak. Árnyaltabb, mint a hamis vs. nem hamis."

Végső soron annak ellenére, hogy Papalexakis olyan rendszert akart kidolgozni, amely olyan kevés felügyeletet igényel, mint lehetséges, elismeri, hogy ez egy olyan kihívás, amelybe mind az embereket, mind az embereket be kell vonni gépek.

„Technológiai szempontból macska-egér játéknak tekintem” – mondta. „Nem hiszem, hogy a „megoldás” mondása a helyes megközelítés. A megoldás részét képezi, ha olyan eszközt biztosítunk az embereknek, amely segíthet nekik megérteni egy cikkel kapcsolatos bizonyos dolgokat. Ez a megoldás olyan eszközök lennének, amelyek segíthetnek maguknak megítélni a dolgokat, aktív állampolgárként tanulni, megérteni a dolgokat és olvasni a sorok között. Nem hiszem, hogy pusztán technológiai megoldást lehetne alkalmazni erre a problémára, mert nagyon sok függ az emberektől és attól, hogy hogyan látják a dolgokat.”

Szerkesztői ajánlások

  • Az algoritmus felülmúlja az embereket az álhírek észlelésében