มนุษย์ไม่สามารถหยุดคำพูดแสดงความเกลียดชังออนไลน์เพียงอย่างเดียวได้ เราต้องการบอทมาช่วย

จอน ไทสัน

อินเทอร์เน็ตมีปัญหาคำพูดแสดงความเกลียดชัง

สารบัญ

  • นี่คืองานสำหรับระบบอัตโนมัติ ชนิดของ
  • ทำให้ปัญหาแย่ลงไม่ดีขึ้น
  • สงครามในสองด้าน
  • ความท้าทายอย่างต่อเนื่อง
  • อนาคตของวาทกรรมบนอินเทอร์เน็ต

ไปที่ส่วนความคิดเห็นของ YouTube หรือค้นหาข้อมูลบนโซเชียลมีเดียในช่วงเวลาสั้นๆ แล้วคุณจะพบกับความคิดเห็นที่น่ารังเกียจและมีอคติบ่อยครั้ง แต่คุณจะแก้ไขปัญหานี้ได้อย่างไร? และในการทำเช่นนั้น คุณจะหลีกเลี่ยงการทำให้แย่ลงโดยไม่ได้ตั้งใจได้อย่างไร?

ในเดือนนี้ A.I. ที่แสวงหาคำพูดแสดงความเกลียดชัง 2 รายการ มีการประกาศอัลกอริธึม: อันหนึ่งสร้างขึ้นในสหราชอาณาจักร และอีกอันหนึ่งในสหรัฐอเมริกา ทั้งสองสามารถใช้งานได้ในหนึ่งวัน เพื่อกัดเซาะโซเชียลมีเดียหรือพื้นที่อื่น ๆ ของโลกออนไลน์ และเน้นคำพูดแสดงความเกลียดชังหรือคำพูดที่ไม่เหมาะสมเพื่อให้สามารถรายงาน ลบ หรือบล็อกได้

วิดีโอแนะนำ

ตัวแรกที่พัฒนาโดยนักวิจัยจากมหาวิทยาลัย Exeter ของสหราชอาณาจักรคือ เครื่องมือชื่อโลล่า ที่ควบคุม "ความก้าวหน้าล่าสุดในการประมวลผลภาษาธรรมชาติและทฤษฎีพฤติกรรม" เพื่อสแกนข้อความหลายพันข้อความต่อนาทีเพื่อค้นหาเนื้อหาที่แสดงความเกลียดชัง “ระดับความแม่นยำนั้นโดดเด่นเมื่อเทียบกับโซลูชันที่มีอยู่ในตลาด”

ดร.เดวิด โลเปซหนึ่งในผู้สร้างของ Lola บอกกับ Digital Trends

ประการที่สองผลงานของ นักวิจัยจากมหาวิทยาลัยเซาเทิร์นแคลิฟอร์เนียอ้างว่ามีความสามารถบางอย่างที่คล้ายกัน “อัลกอริธึมที่เราพัฒนาขึ้นคือตัวแยกประเภทข้อความ ซึ่งใช้โพสต์บนโซเชียลมีเดีย หรืออาจเป็นข้อความอื่น ๆ และคาดการณ์ว่าข้อความนั้นมีคำพูดแสดงความเกลียดชังหรือไม่” เบรนแดน เคนเนดี้, วิทยาการคอมพิวเตอร์ ปริญญาเอก นักเรียนที่ทำงานในโครงการนี้บอกกับ Digital Trends

นี่คืองานสำหรับระบบอัตโนมัติ ชนิดของ

เพื่อให้เข้าใจว่าเหตุใดจึงจำเป็นต้องหันมาใช้โซลูชันอัตโนมัติเพื่อแก้ไขปัญหาที่มนุษย์ส่วนใหญ่นี้ จำเป็นอย่างยิ่งที่จะต้องเข้าใจขนาดที่แท้จริงของโซเชียลมีเดีย ในแต่ละวินาทีของวัน จะมีการส่งทวีตเฉลี่ย 6,000 ครั้ง ซึ่งเท่ากับ 350,000 ทวีตต่อนาที 500 ล้านทวีตต่อวัน หรือ 200 พันล้านทวีตต่อปี บน เฟสบุ๊คมีผู้คนประมาณ 35 ล้านคนอัปเดตสถานะของตนทุกวัน

แม้แต่บริษัทยักษ์ใหญ่ด้านเทคโนโลยีที่มีพนักงานดี ตัวเลขเหล่านี้ทำให้ผู้ตรวจสอบที่เป็นมนุษย์ไม่สามารถดำเนินการดูแลที่จำเป็นได้ด้วยตนเอง การตัดสินใจดังกล่าวจะต้องดำเนินการอย่างรวดเร็ว ไม่ใช่แค่เพื่อติดตามเนื้อหาใหม่ที่สร้างขึ้นทุกขณะ แต่ยังเพื่อไม่ให้ผู้ใช้จำนวนมากเห็นข้อความบางอย่าง อัลกอริธึมที่ออกแบบมาอย่างดีเป็นวิธีเดียวในการแก้ปัญหานี้

“ทุกๆ วินาทีของวัน มีการส่งทวีตโดยเฉลี่ย 6,000 ครั้ง ซึ่งเท่ากับ 350,000 ทวีตต่อนาที 500 ล้านทวีตต่อวัน หรือ 200 พันล้านทวีตต่อปี”

การใช้การเรียนรู้ของเครื่องทำให้เป็นไปได้ (อย่างน้อยในทางทฤษฎี) ในการพัฒนาเครื่องมือที่สามารถฝึกให้ค้นหาคำพูดแสดงความเกลียดชังหรือคำพูดที่ไม่เหมาะสมเพื่อให้สามารถลบหรือรายงานได้ แต่นี่ไม่ใช่เรื่องง่าย คำพูดแสดงความเกลียดชังเป็นคำที่กว้างและมีการโต้แย้ง ความพยายามที่จะให้คำจำกัดความนี้อย่างถูกกฎหมายหรือไม่เป็นทางการในหมู่มนุษย์เป็นเรื่องยาก ตัวอย่างคำพูดแสดงความเกลียดชังบางส่วนอาจมีความชัดเจนจนไม่มีใครสามารถโต้แย้งได้ แต่กรณีอื่นๆ อาจจะละเอียดอ่อนกว่า ประเภทของการกระทำที่มีแนวโน้มที่จะจัดว่าเป็น "การรุกรานระดับจุลภาค" ดังที่พอตเตอร์ สจ๊วร์ต ผู้พิพากษาศาลฎีกาของสหรัฐอเมริกากล่าวไว้อย่างโด่งดังเกี่ยวกับเรื่องอนาจารว่า “ฉันเห็นแล้วฉันก็รู้”

“คำพูดแสดงความเกลียดชังมีหลายประเภท [และ] ภาษาที่ไม่เหมาะสม” Kennedy กล่าวกับ Digital Trends “คำพูดแสดงความเกลียดชังบางคำสามารถแจ้งได้ง่าย เช่น การใส่ร้ายป้ายสี แต่คำพูดแสดงความเกลียดชังส่วนใหญ่มีความซับซ้อนทางวาทศิลป์ ทำลายล้างและลดทอนความเป็นมนุษย์ผ่านการอุปมาอุปไมย การเหมารวมเฉพาะวัฒนธรรม และ 'สุนัขผิวปาก'”

ทำให้ปัญหาแย่ลงไม่ดีขึ้น

ก่อนหน้า A.I. การล่าคำพูดแสดงความเกลียดชัง เครื่องมือได้รับการพิสูจน์แล้วว่าไม่ได้ผลเพราะเป็นเครื่องมือที่ทื่อเกินไปที่จะเปิดเผยตัวอย่างอคติทางออนไลน์ที่ซับซ้อนมากขึ้น อัลกอริธึมการตรวจจับคำพูดแสดงความเกลียดชังที่ออกแบบมาไม่ดีซึ่งห่างไกลจากการหยุดคำพูดแสดงความเกลียดชังทางออนไลน์ จริง ๆ แล้วแสดงให้เห็นเพื่อขยายสิ่งต่าง ๆ เช่น อคติทางเชื้อชาติ โดยการบล็อกทวีตที่ไม่น่ารังเกียจที่ส่งโดยชนกลุ่มน้อย กลุ่ม นั่นอาจเป็นเรื่องง่ายๆ เหมือนกับที่ตัวแยกประเภทคำพูดแสดงความเกลียดชังมีความอ่อนไหวต่อคำต่างๆ อย่างเช่น “คนผิวดำ” “เกย์” หรือ “คนข้ามเพศ” ซึ่งอาจมีแนวโน้มที่จะเชื่อมโยงกับเนื้อหาแสดงความเกลียดชังในบางเรื่อง การตั้งค่า.

เช่นเดียวกับแชทบอท Tay ที่น่าอับอายของ Microsoft ซึ่งได้เรียนรู้ พฤติกรรมเหยียดเชื้อชาติหลังจากการโต้ตอบกับผู้ใช้ตัวแยกประเภทที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลข้อความโซเชียลมีเดียต้นฉบับสามารถจบลงด้วยการพึ่งพาคำเฉพาะเจาะจงอย่างมากโดยไม่สนใจหรือไม่ทราบบริบทโดยรอบ

ความสามารถในการวิเคราะห์ข้อความออนไลน์ในบริบทได้ดีขึ้นคือสิ่งที่ A.I ใหม่ทั้งสอง ระบบการตรวจจับสัญญา ระบบ Lola ของสหราชอาณาจักรอ้างว่าสามารถวิเคราะห์ข้อความ 25,000 ข้อความต่อนาทีเพื่อตรวจจับพฤติกรรมที่เป็นอันตราย — รวมถึงการกลั่นแกล้งบนอินเทอร์เน็ต ความเกลียดชัง และความกลัวอิสลาม — ด้วยความแม่นยำสูงสุด 98% ส่วนหนึ่งของสิ่งนี้ไม่ได้ดูแค่คีย์เวิร์ดเท่านั้น แต่ใช้ "เครื่องมือตรวจจับอารมณ์" เพื่อพิจารณาว่าอารมณ์ใดที่เกิดขึ้นในข้อความ ไม่ว่าจะเป็นความรัก ความโกรธ ความกลัว ความไว้วางใจ หรืออื่นๆ

ขณะเดียวกันมหาวิทยาลัยเซาเทิร์นแคลิฟอร์เนีย A.I. ระบบตรวจจับสัญญาว่าจะดูบริบทและเนื้อหาด้วย

“จุดเริ่มต้นของเราในการวิจัยครั้งนี้คือวิธีการมาตรฐาน ซึ่งเข้ารหัสลำดับของโทเค็นข้อความเป็นตัวเลข เวกเตอร์ซึ่ง [แล้ว] ใช้ในการแสดงป้ายกำกับคลาสของ 'ความเกลียดชัง' หรือ 'ความเกลียดชัง' อย่างน่าจะเป็นไปได้” แบรนดอน พูดว่า. “การใช้อัลกอริธึม 'คำอธิบายหลังเหตุการณ์' ที่สมาชิกในทีมของเราพัฒนาขึ้น เราได้ตั้งโปรแกรมคำพูดแสดงความเกลียดชัง ตัวแยกประเภทเพื่อให้ความสำคัญกับตัวระบุกลุ่มน้อยลง และให้ความสำคัญกับบริบทโดยรอบกลุ่มมากขึ้น ตัวระบุ”

ระบบได้รับการทดสอบโดยการวิเคราะห์บทความจากเว็บไซต์สตอร์มฟรอนต์ ซึ่งเป็นเว็บไซต์ลัทธิเชิดชูคนผิวขาว และรายงานข่าวที่เป็นกลางมากขึ้นของนิวยอร์กไทมส์ ผู้สร้างอ้างว่าสามารถแยกแยะความเกลียดชังจากเนื้อหาที่ไม่แสดงความเกลียดชังได้ด้วยระดับความแม่นยำ 90%

สงครามในสองด้าน

อย่างไรก็ตาม ไม่ใช่แค่นักวิจัยอิสระเท่านั้นที่กำลังพัฒนาเครื่องมือสำหรับตรวจจับคำพูดแสดงความเกลียดชัง เครือข่ายโซเชียลก็กำลังทำงานเพื่อแก้ไขปัญหานี้เช่นกัน

“ตอนนี้เรากำจัดชิ้นส่วนออกไปแล้ว 10 ล้านชิ้น คำพูดแสดงความเกลียดชัง หนึ่งในสี่” Amit Bhattacharyya ผู้อำนวยการฝ่ายการจัดการผลิตภัณฑ์ในกลุ่มความซื่อสัตย์ต่อชุมชนของ Facebook กล่าวกับ Digital Trends “ในนั้น มีการตรวจพบประมาณ 90% ก่อนที่ผู้ใช้จะรายงานให้เราทราบ เราได้ลงทุนมากขึ้นและดีขึ้นในเชิงรุกในการตรวจจับเนื้อหาที่อาจละเมิด รวมถึงคำพูดแสดงความเกลียดชัง”

Bhattacharyya อธิบายเทคนิคการตรวจจับของ Facebook โดยเน้นไปที่การจับคู่ข้อความและรูปภาพ ค้นหารูปภาพและสตริงข้อความที่เหมือนกันซึ่งได้ถูกลบออกไปแล้วในฐานะคำพูดแสดงความเกลียดชังในส่วนอื่นของ แพลตฟอร์ม. นอกจากนี้ยังใช้ตัวแยกประเภทการเรียนรู้ของเครื่องที่วิเคราะห์ภาษาและเนื้อหาประเภทอื่นๆ Facebook มีจุดข้อมูลเพิ่มเติมเช่นกัน เนื่องจากสามารถดูปฏิกิริยาและความคิดเห็นต่อโพสต์เพื่อดูว่าทำอย่างไร สิ่งเหล่านี้ตรงกับวลี รูปแบบ และการโจมตีทั่วไปที่เห็นก่อนหน้านี้ในเนื้อหาที่ละเมิดคำพูดแสดงความเกลียดชัง นโยบาย

“การปราบปรามพฤติกรรมที่ไม่เหมาะสมทางออนไลน์ไม่จำเป็นต้องมีปฏิกิริยาโต้ตอบ มันสามารถเป็นเชิงรุกได้เช่นกัน”

Twitter ยังใช้เครื่องมือการเรียนรู้ของเครื่องเพื่อปราบปรามเนื้อหาที่แสดงความเกลียดชัง บางส่วนอิงตามคำหลัก แต่ Twitter ยังวิเคราะห์พฤติกรรมของผู้ใช้เพิ่มเติมเพื่อพยายามพิจารณาว่าผู้ใช้รู้สึกสบายใจในการโต้ตอบอย่างไร ตัวอย่างเช่น ผู้ใช้ที่ทวีตถึงผู้ใช้รายอื่นและถูกตอบกลับแล้วติดตามจะถูกมองแตกต่างไปจากผู้ใช้ที่ทวีตถึงบุคคลอื่นโดยตรงซ้ำๆ กัน แต่จะถูกเพิกเฉยหรือบล็อก พลวัตของพฤติกรรมเหล่านี้สามารถช่วยเปิดเผยรูปแบบการคุกคามหรือพฤติกรรมที่ไม่ต้องการซึ่งตรงเป้าหมายซึ่ง Twitter สามารถใช้เพื่อทำความเข้าใจเนื้อหาของสิ่งที่เกิดขึ้นบนแพลตฟอร์มได้ดียิ่งขึ้น

อย่างไรก็ตาม โฆษกของ Twitter บอกกับ Digital Trends ว่าข้อความที่ถูกทำเครื่องหมายว่าไม่เหมาะสมจะได้รับการตรวจสอบด้วยตนเอง โดยมนุษย์ (ตามลำดับความสำคัญของเครื่องจักร) เพื่อตรวจสอบว่าพวกเขาได้รับการระบุอย่างถูกต้องว่าเป็น เช่น.

ความท้าทายอย่างต่อเนื่อง

Bhattacharyya จาก Facebook กล่าวว่าโซเชียลเน็ตเวิร์กมี "ความก้าวหน้าอย่างมาก" ในช่วงหลายปีที่ผ่านมาในการควบคุมคำพูดแสดงความเกลียดชังบนแพลตฟอร์มของตน และทีมงานรู้สึกภาคภูมิใจกับความสำเร็จของตน ในเวลาเดียวกัน Bhattacharyya กล่าวว่า “งานของเราไม่มีวันเสร็จสมบูรณ์ และเรารู้ว่าเราอาจไม่สามารถป้องกันไม่ให้เนื้อหาแสดงความเกลียดชังทุกชิ้นปรากฏบนแพลตฟอร์มของเราได้”

ความจริงอันน่าหดหู่ก็คือคำพูดแสดงความเกลียดชังทางออนไลน์อาจจะไม่ได้รับการแก้ไขในฐานะปัญหา อย่างน้อยก็ไม่ใช่หากไม่มีคนทำการเปลี่ยนแปลง อินเทอร์เน็ตอาจขยายเสียงของมนุษย์บางส่วน และฝังและจัดรูปแบบอคติของมนุษย์โดยเฉพาะ แต่นั่นเป็นเพราะมันเป็นเพียงมนุษยชาติที่มีความสำคัญมาก ไม่ว่าปัญหาใดๆ ที่เกิดขึ้นในโลกแห่งความเป็นจริงก็จะเข้าสู่โลกออนไลน์ได้ในระดับหนึ่ง

ทรัมป์พร้อมภาพโลโก้ Facebook และ Twitter
เก็ตตี้อิมเมจ / กราฟิกเทรนด์ดิจิทัล

กล่าวคือ การปราบปรามพฤติกรรมที่ไม่เหมาะสมทางออนไลน์ไม่จำเป็นต้องมีปฏิกิริยาโต้ตอบ มันสามารถเป็นเชิงรุกได้เช่นกัน ตัวอย่างเช่น โฆษกของ Twitter ที่พูดคุยกับ Digital Trends ชี้ให้เห็นว่าผู้ใช้ที่ถูกแบนบัญชีเป็นเวลา 12 ชั่วโมงเนื่องจากการละเมิดกฎ ส่วนใหญ่กลับกระทำความผิดอีกครั้ง นี่แสดงให้เห็นว่าช่วงเวลาที่สอนสามารถเกิดขึ้นได้ ไม่ว่าพวกเขาจะแจ้งให้ผู้ใช้ตรวจสอบพฤติกรรมของตนอีกครั้งจริงๆ หรือเพียงหยุดพวกเขาพฤติกรรมที่ฝ่าฝืนกฎ แต่ก็ช่วยลดพฤติกรรมการละเมิดกฎที่น่ารำคาญบนแพลตฟอร์มได้

โฆษกยังกล่าวอีกว่า Twitter กำลังสำรวจระบบที่ใช้ "สะกิด" ซึ่งจะเสนอการแจ้งเตือนก่อนที่ผู้ใช้จะทวีต โดยแจ้งเตือนว่าสิ่งที่พวกเขากำลังจะโพสต์อาจขัดต่อกฎของ Twitter อาจเป็นเพราะคำหลักบางคำ เมื่อแชร์บทความที่คุณไม่ได้เปิดผ่าน Twitter อาจมีคำเตือนด้วย ระบบเขยิบนี้เพิ่งได้รับการทดสอบกับผู้ใช้จำนวนไม่มาก แม้ว่าการทดลองใช้งานจะสิ้นสุดลงแล้ว แต่ก็มีความเป็นไปได้ที่จะเปิดตัวเป็นฟีเจอร์สำหรับผู้ใช้ทุกคนในอนาคต

อนาคตของวาทกรรมบนอินเทอร์เน็ต

คำถามเกี่ยวกับคำพูดแสดงความเกลียดชังและคำพูดที่ไม่เหมาะสมอื่น ๆ บนโซเชียลมีเดียเป็นเพียงเรื่องเร่งด่วนมากขึ้นเท่านั้น ตัวอย่างเช่นในฝรั่งเศส ก กฎหมายผ่านไปในเดือนพฤษภาคม ที่เรียกร้องให้ลบเนื้อหาทางอาญาบางอย่างออกจากโซเชียลมีเดียภายในหนึ่งชั่วโมง หากไม่เป็นเช่นนั้น บริษัทโซเชียลมีเดียที่เป็นปัญหาจะถูกปรับมากถึง 4% ของรายได้ทั่วโลก เนื้อหาอื่นๆ ที่ "ผิดกฎหมายอย่างชัดแจ้ง" จะต้องถูกลบออกภายใน 24 ชั่วโมง รัฐมนตรีกระทรวงยุติธรรม นิโคล เบลลูเบต์ กล่าวกับรัฐสภาฝรั่งเศสว่ากฎหมายจะช่วยลดคำพูดแสดงความเกลียดชังทางออนไลน์ได้

เท่าที่เราทราบ ไม่มีการเสนอกฎหมายดังกล่าวอย่างจริงจังในสหรัฐอเมริกา แต่เมื่อโซเชียลมีเดียกลายเป็นส่วนที่ใหญ่ขึ้นและมีอิทธิพลมากขึ้นในการสื่อสารของเรา การปราบปรามพฤติกรรมที่เป็นพิษจะมีความสำคัญมากขึ้น นี่ไม่ใช่ปัญหาที่ผู้ดูแลที่เป็นมนุษย์สามารถแก้ไขได้เพียงอย่างเดียว แต่ยังเป็นสิ่งหนึ่งที่เมื่อดำเนินการโดยใช้ A.I. จะต้องดำเนินการอย่างระมัดระวัง ไม่ใช่แค่เพื่อให้แน่ใจว่าจะทำให้ปัญหาดีขึ้น แต่เพื่อรับประกันว่าจะไม่ทำให้แย่ลง

อนาคตของวาทกรรมบนอินเทอร์เน็ตขึ้นอยู่กับมัน

คำแนะนำของบรรณาธิการ

  • A.I. เป็นอย่างไร สร้างไฮไลท์กีฬาที่น่าทึ่งจนคุณไม่สามารถหยุดดูได้

หมวดหมู่

ล่าสุด

เกมยิงอินดี้ OTXO ที่จะดึง John Wick ภายในตัวคุณออกมา

เกมยิงอินดี้ OTXO ที่จะดึง John Wick ภายในตัวคุณออกมา

สิ่งที่ฉันชอบเกี่ยวกับวิดีโอเกมคือการรวมกลุ่มที...

Disney Speedstorm เป็นอีกหนึ่ง Multiversus ที่กำลังสร้าง

Disney Speedstorm เป็นอีกหนึ่ง Multiversus ที่กำลังสร้าง

หากคุณกำลังมองหาภาพรวมที่ชัดเจนของอุตสาหกรรมวิด...

สิ่งที่ Super Mario Bros. ภาพยนตร์เข้าใจผิดเกี่ยวกับเกม

สิ่งที่ Super Mario Bros. ภาพยนตร์เข้าใจผิดเกี่ยวกับเกม

มันปลอดภัยแล้วที่จะพูดแบบนั้น เดอะ ซูเปอร์ มาริ...