შეუძლია Snap-ს გადაარჩინოს ინტერნეტი ყალბი ამბებისგან? აქ არის კომპანიის საიდუმლო იარაღი

ვაგელის პაპალექსაკისიUC Riverside

როდესაც Snapchat პირველად დაინერგა სტენფორდის მექანიკური ინჟინერიის კლასში, კურსის შეშინებული ასისტენტი ღიად ფიქრობდა, შექმნეს თუ არა აპლიკაციის შემქმნელებმა სექსტინგის აპლიკაცია. ათ წელზე ნაკლები ხნის შემდეგ, Snapchat-ს შეუძლია დაეხმაროს გადაჭრას ერთ-ერთი ყველაზე დიდი პრობლემა, რომელსაც ამჟამად აწყდება ტექნოლოგია: შეჩერება "ყალბი ამბების" ონლაინ გავრცელება.

შინაარსი

  • სიგნალი ყალბი ამბებისთვის?
  • კატისა და თაგვის თამაში საუკუნეების განმავლობაში

ამ მიზნის გათვალისწინებით, Snap Research - Snap, Inc-ის კვლევის განყოფილება. - ახლახანს დაფინანსება გადასცა კალიფორნიის უნივერსიტეტის პროექტს, რივერსაიდი, რომელიც მიზნად ისახავს ინტერნეტში ყალბი ამბების აღმოჩენის ახალი ხერხის პოვნას. The ალგორითმი UC Riverside შეიმუშავა გავრცელებული ინფორმაციით, შეუძლია ყალბი ამბების ამოცნობა შთამბეჭდავი სიზუსტით 75 პროცენტამდე. Snap-ის მხარდაჭერით, ისინი იმედოვნებენ, რომ კიდევ უფრო გააუმჯობესებენ ამას.

რეკომენდებული ვიდეოები

”როგორც მე მესმის, მათ ძალიან აინტერესებთ კარგად გაერკვნენ, თუ როგორ შეიძლებოდა ამ პრობლემის გაგება და საბოლოოდ გადაჭრა.”

”Snap არ არის ერთ-ერთი პირველი კომპანია, რომელიც მოიაზრებს [ამ პრობლემის] გათვალისწინებით,” ვაგელის პაპალექსაკისიგანუცხადა Digital Trends-ს UC Riverside-ის კომპიუტერული მეცნიერებისა და ინჟინერიის დეპარტამენტის ასისტენტმა პროფესორმა. „მიუხედავად ამისა, Snap არის კომპანია, რომელიც ამუშავებს შინაარსს. როგორც მე მესმის, მათ ძალიან აინტერესებთ კარგად გაერკვნენ, თუ როგორ შეიძლება ამ პრობლემის გაგება - და საბოლოოდ გადაჭრა. ”

რაც განასხვავებს UC Riverside-ის კვლევას ათეულობით, შესაძლოა ასობით სხვა კვლევითი პროექტისგან, რომლებიც ყალბი ამბების ციკლის გარღვევას ცდილობენ, არის პროექტის ამბიცია. ეს არ არის მარტივი საკვანძო სიტყვების ბლოკერი და არც მიზნად ისახავს გარკვეული URL-ების აბსოლუტური აკრძალვის დაწესებას. არც, ალბათ, ყველაზე საინტერესოა, რომ მას განსაკუთრებით აინტერესებს სიუჟეტებში მოცემული ფაქტები. ეს განასხვავებს მას ფაქტების შემოწმების ვებსაიტებისგან, როგორიცაა Snopes, რომლებიც ეყრდნობიან ადამიანის შეყვანას და შეფასებას ჭეშმარიტი ავტომატიზაციის ნაცვლად.

”მე ნამდვილად არ ვენდობი ადამიანურ ანოტაციებს”, - თქვა პაპალექსაკისმა. ”არა იმიტომ, რომ მე არ ვენდობი ადამიანებს, მაგრამ გავხდე, რომ ეს არსებითად რთული პრობლემაა საბოლოო პასუხის მისაღებად. ამის ჩვენი მოტივაცია მომდინარეობს კითხვაზე, თუ რამდენად შეგვიძლია გავაკეთოთ მხოლოდ მონაცემების დათვალიერებით და შეგვიძლია თუ არა გამოვიყენოთ რაც შეიძლება ნაკლები ადამიანური ანოტაცია – თუ საერთოდ არსებობს“.

სიგნალი ყალბი ამბებისთვის?

ახალი ალგორითმი უყურებს რაც შეიძლება მეტ „სიგნალს“ ახალი ამბებიდან და იყენებს ამას სტატიის სანდოობის კლასიფიკაციისთვის. პაპალექსაკისმა თქვა: „ვინ გააზიარა სტატია? რა ჰეშტაგები გამოიყენეს? Ვინ დაწერა ეს? რომელი საინფორმაციო ორგანიზაციიდან არის? როგორ გამოიყურება ვებგვერდი? ჩვენ ვცდილობთ გაერკვნენ, თუ რომელი ფაქტორები [მნიშვნელოვანია] და რამდენად დიდი გავლენა აქვთ მათ. ”

მაგალითად, ჰეშთეგი #LockHerUp შეიძლება სულაც არ დაადასტუროს, რომ სტატია თავისთავად ყალბი ამბავია. თუმცა, თუ ადამიანი დაამატებს ამ სუფიქსს, როდესაც აზიარებს სტატიას Twitter-ზე, ეს შეიძლება მიუთითებდეს ამბის გარკვეულ დახრილობაზე. დაამატე საკმარისად ეს მინიშნებები ერთად და იდეა ისაა, რომ ცალკეული ნაწილაკები გამოავლენს მთლიანობას. სხვაგვარად რომ ვთქვათ, თუ ის იხვივით დადის და იხვივით კვდება, დიდი შანსია, რომ ის იხვია. ან, ამ შემთხვევაში, ჭუჭყიანი, კვარცხლბეკი, ალტ-მარჯვენა რუსული იხვი ბოტი.

ყალბი ამბების პროტესტი
snapchat მხარდამჭერი ალგორითმის წინააღმდეგ ბრძოლა ყალბი ამბების პროტესტის getty2

„ჩვენი ინტერესი არის გავიგოთ, რა ხდება ადრეულ ეტაპზე და როგორ შეგვიძლია დავაფიქსიროთ რაღაც ადრეულ ეტაპზე, სანამ ის ქსელის „დაინფიცირებას“ დაიწყებს“, - განაგრძო პაპალექსაკისმა. ”ამჟამად ეს არის ჩვენი ინტერესი: შევიმუშაოთ ის, რისი ამოღება შეგვიძლია კონკრეტული სტატიის შინაარსიდან და კონტექსტიდან.”

პაპალექსაკისის ჯგუფის მიერ შემუშავებული ალგორითმი იყენებს რაღაცას, რომელსაც ეწოდება ტენსორის დაშლა ახალი ამბების სტატიის შესახებ ინფორმაციის სხვადასხვა ნაკადის გასაანალიზებლად. ტენსორები არის მრავალგანზომილებიანი კუბურები, გამოსადეგი მონაცემების მოდელირებისთვის და ანალიზისთვის, რომლებსაც აქვთ მრავალი განსხვავებული კომპონენტი. ტენზორის დაშლა შესაძლებელს ხდის მონაცემების შაბლონების აღმოჩენას ტენზორის ელემენტარულ ინფორმაციად დაყოფით, რომელიც წარმოადგენს კონკრეტულ შაბლონს ან თემას.

„ანოტირებული სტატიების სასაცილოდ მცირე რაოდენობამაც კი შეიძლება მიგვიყვანოს სიზუსტის ძალიან მაღალ დონემდე“

ალგორითმი პირველად იყენებს ტენსორის დაშლას, რათა წარმოადგინოს მონაცემები ისე, რომ ის აჯგუფებს შესაძლო ყალბ ახალ ამბებს. შემდეგ ალგორითმის მეორე დონე აკავშირებს სტატიებს, რომლებიც მიჩნეულია ერთმანეთთან ახლოს. ამ სტატიებს შორის კავშირის დახატვა ეყრდნობა პრინციპს, რომელსაც ეწოდება "დანაშაული ასოციაციის გზით". ვარაუდობენ, რომ ორ სტატიას შორის კავშირი ნიშნავს, რომ ისინი უფრო მეტად ჰგავს ერთს სხვა.

ამის შემდეგ, მანქანური სწავლება გამოიყენება გრაფიკებზე. ეს „ნახევრად ზედამხედველობით“ მიდგომა იყენებს სტატიების მცირე რაოდენობას, რომლებიც კატეგორიზებულია მომხმარებლების მიერ და შემდეგ იყენებს ამ ცოდნას ბევრად უფრო დიდ მონაცემთა ნაკრებში. მიუხედავად იმისა, რომ ეს ჯერ კიდევ გარკვეულ დონეზე ეხება ადამიანებს, ის მოიცავს ნაკლებ ადამიანურ ანოტაციას, ვიდრე პოტენციური ყალბი ამბების კლასიფიკაციის ალტერნატიული მეთოდები. მკვლევარების მიერ რეკლამირებული 75 პროცენტიანი სიზუსტის დონე ეფუძნება ორი საჯარო მონაცემთა ნაკრების სწორ ფილტრაციას და 63,000 ახალი ამბების სტატიის დამატებით კოლექციას.

„ანოტირებული სტატიების სასაცილოდ მცირე რაოდენობამაც კი შეიძლება მიგვიყვანოს სიზუსტის ძალიან მაღალ დონემდე“, - თქვა პაპალექსაკისმა. „ეს გაცილებით მაღალია, ვიდრე გვქონდეს სისტემა, სადაც ჩვენ ვცდილობდით ინდივიდუალური მახასიათებლების აღბეჭდვას, როგორიცაა ლინგვისტიკა, ან სხვა რამ, რაც ადამიანებმა შეიძლება დეზინფორმაციულად მიიჩნიონ“.

კატისა და თაგვის თამაში საუკუნეების განმავლობაში

კომპიუტერული მეცნიერების თვალსაზრისით, ადვილი მისახვედრია, თუ რატომ მოეწონება ეს ნამუშევარი ვაგელის პაპალექსაკისსა და UC Riverside-ის სხვა მკვლევარებს - ისევე როგორც Snapchat-ის ხალხს. შეძლებთ არა მხოლოდ დაალაგოთ ყალბი ამბები რეალური ამბებისგან, არამედ განასხვავოთ მიკერძოებული სტატიები სერიოზული ჟურნალისტიკისგან ან სატირული სტატიებისგან. Ხახვი არის ისეთი სახის დიდი მონაცემების თავსატეხი, რომელზეც ინჟინრები ოცნებობენ.

თუმცა, უფრო დიდი კითხვაა, თუ როგორ იქნება გამოყენებული ეს ალგორითმი - და შეუძლია თუ არა მას საბოლოო ჯამში დაეხმაროს ყალბი ამბების ფენომენის განადგურებას.

Snap-ის წვლილი პროექტში (რაც შეადგენს 7000 აშშ დოლარის „საჩუქარს“ და დამატებით არაფინანსურ მხარდაჭერას) არ იძლევა გარანტიას, რომ კომპანია მიიღებს ტექნოლოგიას კომერციულ პროდუქტში. მაგრამ პაპალექსაკისმა თქვა, რომ იმედოვნებს, რომ კვლევა საბოლოოდ "მიგვიყვანს პლატფორმაზე ტექნიკური გადაცემისკენ".

საბოლოო მიზანი, მან განმარტა, არის სისტემის შემუშავება, რომელიც შეძლებს ნებისმიერ სტატიას მიაწოდოს სანდოობის ქულა. თეორიულად, ასეთი ქულა შეიძლება გამოყენებულ იქნას ყალბი ამბების გასაფილტრად, სანამ ის მომხმარებელთა თვალთახედვის შესაძლებლობას მისცემს.

ეს არ არის განსხვავებული იდეა მანქანური სწავლების ელ.ფოსტის სპამის ფილტრებისგან, რომლებიც ასევე იყენებენ ქულების სისტემას, რომელიც დაფუძნებულია ფაქტორებზე, როგორიცაა სურათისა და ტექსტის თანაფარდობა შეტყობინებაში. თუმცა, პაპალექსაკისმა შესთავაზა, რომ სასურველი მიდგომა შეიძლება იყოს მომხმარებლების გაფრთხილება მათზე სიუჟეტები, რომლებიც მაღალი ქულებით იღებენ შესაძლო ყალბ კატეგორიას - „და შემდეგ მიეცით მომხმარებელმა გადაწყვიტოს რა გააკეთოს ის.”

ამის ერთ-ერთი კარგი მიზეზი არის ის ფაქტი, რომ სიახლეები ყოველთვის ასე კარგად არ იყოფა სპამად და წინააღმდეგ. ლორის კატეგორიები, როგორც ამას ელფოსტა აკეთებს. რა თქმა უნდა, ზოგიერთი სტატია შეიძლება იყოს უაზრო ფაბრიკაცია, მაგრამ სხვები შეიძლება იყოს უფრო საეჭვო: არ შეიცავს პირდაპირ სიცრუეს, მაგრამ მიუხედავად ამისა, მიზნად ისახავს მკითხველის მიყვანას გარკვეული მიმართულებით. ამ სტატიების წაშლა, მაშინაც კი, როდესაც შეიძლება აღმოვაჩინოთ, რომ ჩვენს აზრს ეწინააღმდეგება, უფრო წებოვან ტერიტორიაზე გადადის.

”ეს ხვდება ნაცრისფერ ზონაში,” განაგრძო პაპალექსაკისმა. ”კარგია, თუ ჩვენ შეგვიძლია დავახარისხოთ ეს, როგორც ძლიერ მიკერძოებული სტატია. არსებობს სხვადასხვა კატეგორიები, რასაც შეიძლება დეზინფორმაცია ვუწოდოთ. [ძლიერად მიკერძოებული სტატია] შეიძლება არ იყოს ისეთი ცუდი, როგორც პირდაპირი ყალბი სტატია, მაგრამ ის მაინც ყიდის კონკრეტულ თვალსაზრისს მკითხველს. ეს უფრო ნიუანსია, ვიდრე ყალბი vs. არა ყალბი."

საბოლოო ჯამში, მიუხედავად პაპალექსაკისის სურვილისა, შეექმნა სისტემა, რომელიც იყენებს მცირე ზედამხედველობას შესაძლებელია, ის აღიარებს, რომ ეს არის გამოწვევა, რომელიც უნდა მოიცავდეს როგორც ადამიანებს, ასევე მანქანები.

”მე მას ვხედავ, როგორც კატა-თაგვის თამაშს ტექნოლოგიური თვალსაზრისით,” - თქვა მან. „არ მგონია, რომ „მისი გადაჭრა“ თქვა, ამის შესახედად სწორი გზაა. ხალხისთვის ისეთი ხელსაწყოს მიწოდება, რომელიც დაეხმარება მათ სტატიის შესახებ კონკრეტული საკითხების გაგებაში, გადაწყვეტის ნაწილია. ეს გამოსავალი იქნება ინსტრუმენტები, რომლებიც დაგეხმარებათ თავად განსაჯოთ საგნები, იყოთ განათლებული, როგორც აქტიური მოქალაქე, გაიგოთ საგნები და წაიკითხოთ სტრიქონებს შორის. მე არ ვფიქრობ, რომ მხოლოდ ტექნოლოგიური გადაწყვეტა შეიძლება გამოყენებულ იქნას ამ პრობლემასთან დაკავშირებით, რადგან ბევრი რამ დამოკიდებულია ადამიანებზე და იმაზე, თუ როგორ ხედავენ ისინი საგნებს. ”

რედაქტორების რეკომენდაციები

  • ალგორითმი აჯობებს ადამიანებს ყალბი ამბების ამოცნობაში

კატეგორიები

Ბოლო

4 ტენდენცია, რომელმაც შესაძლოა შეარყიოს სათამაშო სამყარო 2023 წელს

4 ტენდენცია, რომელმაც შესაძლოა შეარყიოს სათამაშო სამყარო 2023 წელს

ყოველი გასული წელი, როგორც ჩანს, საეტაპო წელია ...

10 საუკეთესო ომის ფილმი ოდესმე გადაღებული

10 საუკეთესო ომის ფილმი ოდესმე გადაღებული

ომი ისეთივე ძველი ჟანრია, როგორც თავად ფილმები....