มนุษย์ไม่สามารถหยุดคำพูดแสดงความเกลียดชังออนไลน์เพียงอย่างเดียวได้ เราต้องการบอทมาช่วย

จอน ไทสัน

อินเทอร์เน็ตมีปัญหาคำพูดแสดงความเกลียดชัง

สารบัญ

  • นี่คืองานสำหรับระบบอัตโนมัติ ชนิดของ
  • ทำให้ปัญหาแย่ลงไม่ดีขึ้น
  • สงครามในสองด้าน
  • ความท้าทายอย่างต่อเนื่อง
  • อนาคตของวาทกรรมบนอินเทอร์เน็ต

ไปที่ส่วนความคิดเห็นของ YouTube หรือค้นหาข้อมูลบนโซเชียลมีเดียในช่วงเวลาสั้นๆ แล้วคุณจะพบกับความคิดเห็นที่น่ารังเกียจและมีอคติบ่อยครั้ง แต่คุณจะแก้ไขปัญหานี้ได้อย่างไร? และในการทำเช่นนั้น คุณจะหลีกเลี่ยงการทำให้แย่ลงโดยไม่ได้ตั้งใจได้อย่างไร?

ในเดือนนี้ A.I. ที่แสวงหาคำพูดแสดงความเกลียดชัง 2 รายการ มีการประกาศอัลกอริธึม: อันหนึ่งสร้างขึ้นในสหราชอาณาจักร และอีกอันหนึ่งในสหรัฐอเมริกา ทั้งสองสามารถใช้งานได้ในหนึ่งวัน เพื่อกัดเซาะโซเชียลมีเดียหรือพื้นที่อื่น ๆ ของโลกออนไลน์ และเน้นคำพูดแสดงความเกลียดชังหรือคำพูดที่ไม่เหมาะสมเพื่อให้สามารถรายงาน ลบ หรือบล็อกได้

วิดีโอแนะนำ

ตัวแรกที่พัฒนาโดยนักวิจัยจากมหาวิทยาลัย Exeter ของสหราชอาณาจักรคือ เครื่องมือชื่อโลล่า ที่ควบคุม "ความก้าวหน้าล่าสุดในการประมวลผลภาษาธรรมชาติและทฤษฎีพฤติกรรม" เพื่อสแกนข้อความหลายพันข้อความต่อนาทีเพื่อค้นหาเนื้อหาที่แสดงความเกลียดชัง “ระดับความแม่นยำนั้นโดดเด่นเมื่อเทียบกับโซลูชันที่มีอยู่ในตลาด”

ดร.เดวิด โลเปซหนึ่งในผู้สร้างของ Lola บอกกับ Digital Trends

ประการที่สองผลงานของ นักวิจัยจากมหาวิทยาลัยเซาเทิร์นแคลิฟอร์เนียอ้างว่ามีความสามารถบางอย่างที่คล้ายกัน “อัลกอริธึมที่เราพัฒนาขึ้นคือตัวแยกประเภทข้อความ ซึ่งใช้โพสต์บนโซเชียลมีเดีย หรืออาจเป็นข้อความอื่น ๆ และคาดการณ์ว่าข้อความนั้นมีคำพูดแสดงความเกลียดชังหรือไม่” เบรนแดน เคนเนดี้, วิทยาการคอมพิวเตอร์ ปริญญาเอก นักเรียนที่ทำงานในโครงการนี้บอกกับ Digital Trends

นี่คืองานสำหรับระบบอัตโนมัติ ชนิดของ

เพื่อให้เข้าใจว่าเหตุใดจึงจำเป็นต้องหันมาใช้โซลูชันอัตโนมัติเพื่อแก้ไขปัญหาที่มนุษย์ส่วนใหญ่นี้ จำเป็นอย่างยิ่งที่จะต้องเข้าใจขนาดที่แท้จริงของโซเชียลมีเดีย ในแต่ละวินาทีของวัน จะมีการส่งทวีตเฉลี่ย 6,000 ครั้ง ซึ่งเท่ากับ 350,000 ทวีตต่อนาที 500 ล้านทวีตต่อวัน หรือ 200 พันล้านทวีตต่อปี บน เฟสบุ๊คมีผู้คนประมาณ 35 ล้านคนอัปเดตสถานะของตนทุกวัน

แม้แต่บริษัทยักษ์ใหญ่ด้านเทคโนโลยีที่มีพนักงานดี ตัวเลขเหล่านี้ทำให้ผู้ตรวจสอบที่เป็นมนุษย์ไม่สามารถดำเนินการดูแลที่จำเป็นได้ด้วยตนเอง การตัดสินใจดังกล่าวจะต้องดำเนินการอย่างรวดเร็ว ไม่ใช่แค่เพื่อติดตามเนื้อหาใหม่ที่สร้างขึ้นทุกขณะ แต่ยังเพื่อไม่ให้ผู้ใช้จำนวนมากเห็นข้อความบางอย่าง อัลกอริธึมที่ออกแบบมาอย่างดีเป็นวิธีเดียวในการแก้ปัญหานี้

“ทุกๆ วินาทีของวัน มีการส่งทวีตโดยเฉลี่ย 6,000 ครั้ง ซึ่งเท่ากับ 350,000 ทวีตต่อนาที 500 ล้านทวีตต่อวัน หรือ 200 พันล้านทวีตต่อปี”

การใช้การเรียนรู้ของเครื่องทำให้เป็นไปได้ (อย่างน้อยในทางทฤษฎี) ในการพัฒนาเครื่องมือที่สามารถฝึกให้ค้นหาคำพูดแสดงความเกลียดชังหรือคำพูดที่ไม่เหมาะสมเพื่อให้สามารถลบหรือรายงานได้ แต่นี่ไม่ใช่เรื่องง่าย คำพูดแสดงความเกลียดชังเป็นคำที่กว้างและมีการโต้แย้ง ความพยายามที่จะให้คำจำกัดความนี้อย่างถูกกฎหมายหรือไม่เป็นทางการในหมู่มนุษย์เป็นเรื่องยาก ตัวอย่างคำพูดแสดงความเกลียดชังบางส่วนอาจมีความชัดเจนจนไม่มีใครสามารถโต้แย้งได้ แต่กรณีอื่นๆ อาจจะละเอียดอ่อนกว่า ประเภทของการกระทำที่มีแนวโน้มที่จะจัดว่าเป็น "การรุกรานระดับจุลภาค" ดังที่พอตเตอร์ สจ๊วร์ต ผู้พิพากษาศาลฎีกาของสหรัฐอเมริกากล่าวไว้อย่างโด่งดังเกี่ยวกับเรื่องอนาจารว่า “ฉันเห็นแล้วฉันก็รู้”

“คำพูดแสดงความเกลียดชังมีหลายประเภท [และ] ภาษาที่ไม่เหมาะสม” Kennedy กล่าวกับ Digital Trends “คำพูดแสดงความเกลียดชังบางคำสามารถแจ้งได้ง่าย เช่น การใส่ร้ายป้ายสี แต่คำพูดแสดงความเกลียดชังส่วนใหญ่มีความซับซ้อนทางวาทศิลป์ ทำลายล้างและลดทอนความเป็นมนุษย์ผ่านการอุปมาอุปไมย การเหมารวมเฉพาะวัฒนธรรม และ 'สุนัขผิวปาก'”

ทำให้ปัญหาแย่ลงไม่ดีขึ้น

ก่อนหน้า A.I. การล่าคำพูดแสดงความเกลียดชัง เครื่องมือได้รับการพิสูจน์แล้วว่าไม่ได้ผลเพราะเป็นเครื่องมือที่ทื่อเกินไปที่จะเปิดเผยตัวอย่างอคติทางออนไลน์ที่ซับซ้อนมากขึ้น อัลกอริธึมการตรวจจับคำพูดแสดงความเกลียดชังที่ออกแบบมาไม่ดีซึ่งห่างไกลจากการหยุดคำพูดแสดงความเกลียดชังทางออนไลน์ จริง ๆ แล้วแสดงให้เห็นเพื่อขยายสิ่งต่าง ๆ เช่น อคติทางเชื้อชาติ โดยการบล็อกทวีตที่ไม่น่ารังเกียจที่ส่งโดยชนกลุ่มน้อย กลุ่ม นั่นอาจเป็นเรื่องง่ายๆ เหมือนกับที่ตัวแยกประเภทคำพูดแสดงความเกลียดชังมีความอ่อนไหวต่อคำต่างๆ อย่างเช่น “คนผิวดำ” “เกย์” หรือ “คนข้ามเพศ” ซึ่งอาจมีแนวโน้มที่จะเชื่อมโยงกับเนื้อหาแสดงความเกลียดชังในบางเรื่อง การตั้งค่า.

เช่นเดียวกับแชทบอท Tay ที่น่าอับอายของ Microsoft ซึ่งได้เรียนรู้ พฤติกรรมเหยียดเชื้อชาติหลังจากการโต้ตอบกับผู้ใช้ตัวแยกประเภทที่ได้รับการฝึกอบรมเกี่ยวกับข้อมูลข้อความโซเชียลมีเดียต้นฉบับสามารถจบลงด้วยการพึ่งพาคำเฉพาะเจาะจงอย่างมากโดยไม่สนใจหรือไม่ทราบบริบทโดยรอบ

ความสามารถในการวิเคราะห์ข้อความออนไลน์ในบริบทได้ดีขึ้นคือสิ่งที่ A.I ใหม่ทั้งสอง ระบบการตรวจจับสัญญา ระบบ Lola ของสหราชอาณาจักรอ้างว่าสามารถวิเคราะห์ข้อความ 25,000 ข้อความต่อนาทีเพื่อตรวจจับพฤติกรรมที่เป็นอันตราย — รวมถึงการกลั่นแกล้งบนอินเทอร์เน็ต ความเกลียดชัง และความกลัวอิสลาม — ด้วยความแม่นยำสูงสุด 98% ส่วนหนึ่งของสิ่งนี้ไม่ได้ดูแค่คีย์เวิร์ดเท่านั้น แต่ใช้ "เครื่องมือตรวจจับอารมณ์" เพื่อพิจารณาว่าอารมณ์ใดที่เกิดขึ้นในข้อความ ไม่ว่าจะเป็นความรัก ความโกรธ ความกลัว ความไว้วางใจ หรืออื่นๆ

ขณะเดียวกันมหาวิทยาลัยเซาเทิร์นแคลิฟอร์เนีย A.I. ระบบตรวจจับสัญญาว่าจะดูบริบทและเนื้อหาด้วย

“จุดเริ่มต้นของเราในการวิจัยครั้งนี้คือวิธีการมาตรฐาน ซึ่งเข้ารหัสลำดับของโทเค็นข้อความเป็นตัวเลข เวกเตอร์ซึ่ง [แล้ว] ใช้ในการแสดงป้ายกำกับคลาสของ 'ความเกลียดชัง' หรือ 'ความเกลียดชัง' อย่างน่าจะเป็นไปได้” แบรนดอน พูดว่า. “การใช้อัลกอริธึม 'คำอธิบายหลังเหตุการณ์' ที่สมาชิกในทีมของเราพัฒนาขึ้น เราได้ตั้งโปรแกรมคำพูดแสดงความเกลียดชัง ตัวแยกประเภทเพื่อให้ความสำคัญกับตัวระบุกลุ่มน้อยลง และให้ความสำคัญกับบริบทโดยรอบกลุ่มมากขึ้น ตัวระบุ”

ระบบได้รับการทดสอบโดยการวิเคราะห์บทความจากเว็บไซต์สตอร์มฟรอนต์ ซึ่งเป็นเว็บไซต์ลัทธิเชิดชูคนผิวขาว และรายงานข่าวที่เป็นกลางมากขึ้นของนิวยอร์กไทมส์ ผู้สร้างอ้างว่าสามารถแยกแยะความเกลียดชังจากเนื้อหาที่ไม่แสดงความเกลียดชังได้ด้วยระดับความแม่นยำ 90%

สงครามในสองด้าน

อย่างไรก็ตาม ไม่ใช่แค่นักวิจัยอิสระเท่านั้นที่กำลังพัฒนาเครื่องมือสำหรับตรวจจับคำพูดแสดงความเกลียดชัง เครือข่ายโซเชียลก็กำลังทำงานเพื่อแก้ไขปัญหานี้เช่นกัน

“ตอนนี้เรากำจัดชิ้นส่วนออกไปแล้ว 10 ล้านชิ้น คำพูดแสดงความเกลียดชัง หนึ่งในสี่” Amit Bhattacharyya ผู้อำนวยการฝ่ายการจัดการผลิตภัณฑ์ในกลุ่มความซื่อสัตย์ต่อชุมชนของ Facebook กล่าวกับ Digital Trends “ในนั้น มีการตรวจพบประมาณ 90% ก่อนที่ผู้ใช้จะรายงานให้เราทราบ เราได้ลงทุนมากขึ้นและดีขึ้นในเชิงรุกในการตรวจจับเนื้อหาที่อาจละเมิด รวมถึงคำพูดแสดงความเกลียดชัง”

Bhattacharyya อธิบายเทคนิคการตรวจจับของ Facebook โดยเน้นไปที่การจับคู่ข้อความและรูปภาพ ค้นหารูปภาพและสตริงข้อความที่เหมือนกันซึ่งได้ถูกลบออกไปแล้วในฐานะคำพูดแสดงความเกลียดชังในส่วนอื่นของ แพลตฟอร์ม. นอกจากนี้ยังใช้ตัวแยกประเภทการเรียนรู้ของเครื่องที่วิเคราะห์ภาษาและเนื้อหาประเภทอื่นๆ Facebook มีจุดข้อมูลเพิ่มเติมเช่นกัน เนื่องจากสามารถดูปฏิกิริยาและความคิดเห็นต่อโพสต์เพื่อดูว่าทำอย่างไร สิ่งเหล่านี้ตรงกับวลี รูปแบบ และการโจมตีทั่วไปที่เห็นก่อนหน้านี้ในเนื้อหาที่ละเมิดคำพูดแสดงความเกลียดชัง นโยบาย

“การปราบปรามพฤติกรรมที่ไม่เหมาะสมทางออนไลน์ไม่จำเป็นต้องมีปฏิกิริยาโต้ตอบ มันสามารถเป็นเชิงรุกได้เช่นกัน”

Twitter ยังใช้เครื่องมือการเรียนรู้ของเครื่องเพื่อปราบปรามเนื้อหาที่แสดงความเกลียดชัง บางส่วนอิงตามคำหลัก แต่ Twitter ยังวิเคราะห์พฤติกรรมของผู้ใช้เพิ่มเติมเพื่อพยายามพิจารณาว่าผู้ใช้รู้สึกสบายใจในการโต้ตอบอย่างไร ตัวอย่างเช่น ผู้ใช้ที่ทวีตถึงผู้ใช้รายอื่นและถูกตอบกลับแล้วติดตามจะถูกมองแตกต่างไปจากผู้ใช้ที่ทวีตถึงบุคคลอื่นโดยตรงซ้ำๆ กัน แต่จะถูกเพิกเฉยหรือบล็อก พลวัตของพฤติกรรมเหล่านี้สามารถช่วยเปิดเผยรูปแบบการคุกคามหรือพฤติกรรมที่ไม่ต้องการซึ่งตรงเป้าหมายซึ่ง Twitter สามารถใช้เพื่อทำความเข้าใจเนื้อหาของสิ่งที่เกิดขึ้นบนแพลตฟอร์มได้ดียิ่งขึ้น

อย่างไรก็ตาม โฆษกของ Twitter บอกกับ Digital Trends ว่าข้อความที่ถูกทำเครื่องหมายว่าไม่เหมาะสมจะได้รับการตรวจสอบด้วยตนเอง โดยมนุษย์ (ตามลำดับความสำคัญของเครื่องจักร) เพื่อตรวจสอบว่าพวกเขาได้รับการระบุอย่างถูกต้องว่าเป็น เช่น.

ความท้าทายอย่างต่อเนื่อง

Bhattacharyya จาก Facebook กล่าวว่าโซเชียลเน็ตเวิร์กมี "ความก้าวหน้าอย่างมาก" ในช่วงหลายปีที่ผ่านมาในการควบคุมคำพูดแสดงความเกลียดชังบนแพลตฟอร์มของตน และทีมงานรู้สึกภาคภูมิใจกับความสำเร็จของตน ในเวลาเดียวกัน Bhattacharyya กล่าวว่า “งานของเราไม่มีวันเสร็จสมบูรณ์ และเรารู้ว่าเราอาจไม่สามารถป้องกันไม่ให้เนื้อหาแสดงความเกลียดชังทุกชิ้นปรากฏบนแพลตฟอร์มของเราได้”

ความจริงอันน่าหดหู่ก็คือคำพูดแสดงความเกลียดชังทางออนไลน์อาจจะไม่ได้รับการแก้ไขในฐานะปัญหา อย่างน้อยก็ไม่ใช่หากไม่มีคนทำการเปลี่ยนแปลง อินเทอร์เน็ตอาจขยายเสียงของมนุษย์บางส่วน และฝังและจัดรูปแบบอคติของมนุษย์โดยเฉพาะ แต่นั่นเป็นเพราะมันเป็นเพียงมนุษยชาติที่มีความสำคัญมาก ไม่ว่าปัญหาใดๆ ที่เกิดขึ้นในโลกแห่งความเป็นจริงก็จะเข้าสู่โลกออนไลน์ได้ในระดับหนึ่ง

ทรัมป์พร้อมภาพโลโก้ Facebook และ Twitter
เก็ตตี้อิมเมจ / กราฟิกเทรนด์ดิจิทัล

กล่าวคือ การปราบปรามพฤติกรรมที่ไม่เหมาะสมทางออนไลน์ไม่จำเป็นต้องมีปฏิกิริยาโต้ตอบ มันสามารถเป็นเชิงรุกได้เช่นกัน ตัวอย่างเช่น โฆษกของ Twitter ที่พูดคุยกับ Digital Trends ชี้ให้เห็นว่าผู้ใช้ที่ถูกแบนบัญชีเป็นเวลา 12 ชั่วโมงเนื่องจากการละเมิดกฎ ส่วนใหญ่กลับกระทำความผิดอีกครั้ง นี่แสดงให้เห็นว่าช่วงเวลาที่สอนสามารถเกิดขึ้นได้ ไม่ว่าพวกเขาจะแจ้งให้ผู้ใช้ตรวจสอบพฤติกรรมของตนอีกครั้งจริงๆ หรือเพียงหยุดพวกเขาพฤติกรรมที่ฝ่าฝืนกฎ แต่ก็ช่วยลดพฤติกรรมการละเมิดกฎที่น่ารำคาญบนแพลตฟอร์มได้

โฆษกยังกล่าวอีกว่า Twitter กำลังสำรวจระบบที่ใช้ "สะกิด" ซึ่งจะเสนอการแจ้งเตือนก่อนที่ผู้ใช้จะทวีต โดยแจ้งเตือนว่าสิ่งที่พวกเขากำลังจะโพสต์อาจขัดต่อกฎของ Twitter อาจเป็นเพราะคำหลักบางคำ เมื่อแชร์บทความที่คุณไม่ได้เปิดผ่าน Twitter อาจมีคำเตือนด้วย ระบบเขยิบนี้เพิ่งได้รับการทดสอบกับผู้ใช้จำนวนไม่มาก แม้ว่าการทดลองใช้งานจะสิ้นสุดลงแล้ว แต่ก็มีความเป็นไปได้ที่จะเปิดตัวเป็นฟีเจอร์สำหรับผู้ใช้ทุกคนในอนาคต

อนาคตของวาทกรรมบนอินเทอร์เน็ต

คำถามเกี่ยวกับคำพูดแสดงความเกลียดชังและคำพูดที่ไม่เหมาะสมอื่น ๆ บนโซเชียลมีเดียเป็นเพียงเรื่องเร่งด่วนมากขึ้นเท่านั้น ตัวอย่างเช่นในฝรั่งเศส ก กฎหมายผ่านไปในเดือนพฤษภาคม ที่เรียกร้องให้ลบเนื้อหาทางอาญาบางอย่างออกจากโซเชียลมีเดียภายในหนึ่งชั่วโมง หากไม่เป็นเช่นนั้น บริษัทโซเชียลมีเดียที่เป็นปัญหาจะถูกปรับมากถึง 4% ของรายได้ทั่วโลก เนื้อหาอื่นๆ ที่ "ผิดกฎหมายอย่างชัดแจ้ง" จะต้องถูกลบออกภายใน 24 ชั่วโมง รัฐมนตรีกระทรวงยุติธรรม นิโคล เบลลูเบต์ กล่าวกับรัฐสภาฝรั่งเศสว่ากฎหมายจะช่วยลดคำพูดแสดงความเกลียดชังทางออนไลน์ได้

เท่าที่เราทราบ ไม่มีการเสนอกฎหมายดังกล่าวอย่างจริงจังในสหรัฐอเมริกา แต่เมื่อโซเชียลมีเดียกลายเป็นส่วนที่ใหญ่ขึ้นและมีอิทธิพลมากขึ้นในการสื่อสารของเรา การปราบปรามพฤติกรรมที่เป็นพิษจะมีความสำคัญมากขึ้น นี่ไม่ใช่ปัญหาที่ผู้ดูแลที่เป็นมนุษย์สามารถแก้ไขได้เพียงอย่างเดียว แต่ยังเป็นสิ่งหนึ่งที่เมื่อดำเนินการโดยใช้ A.I. จะต้องดำเนินการอย่างระมัดระวัง ไม่ใช่แค่เพื่อให้แน่ใจว่าจะทำให้ปัญหาดีขึ้น แต่เพื่อรับประกันว่าจะไม่ทำให้แย่ลง

อนาคตของวาทกรรมบนอินเทอร์เน็ตขึ้นอยู่กับมัน

คำแนะนำของบรรณาธิการ

  • A.I. เป็นอย่างไร สร้างไฮไลท์กีฬาที่น่าทึ่งจนคุณไม่สามารถหยุดดูได้

หมวดหมู่

ล่าสุด

Castlevania ของ Netflix ควรเป็นเกมแนวดาร์คแฟนตาซีครั้งต่อไปของคุณ

Castlevania ของ Netflix ควรเป็นเกมแนวดาร์คแฟนตาซีครั้งต่อไปของคุณ

ในขณะที่ "คำสาปวิดีโอเกม" ที่น่าอับอายยังคงแพร่...

5 วิดีโอเกมที่จะเล่นหลังจากที่คุณดู Andor แล้ว

5 วิดีโอเกมที่จะเล่นหลังจากที่คุณดู Andor แล้ว

ในขณะที่ความอิ่มตัวของเนื้อหาบน ดิสนีย์+ กำลังเ...

อดีตของ Star Wars มีศักยภาพสำหรับละครที่เหมือน Game of Thrones

อดีตของ Star Wars มีศักยภาพสำหรับละครที่เหมือน Game of Thrones

ในขณะที่กำลังพิจารณาอีก IP ขนาดใหญ่ ดิสนีย์+ ซี...