นักค้นคว้าจากมหาวิทยาลัยมิชิแกนที่ปรับปรุงระบบได้ทำให้เห็นว่ามันเทียบได้กับ รับทำการตลาด ครั้งคราวและดียิ่งกว่ามนุษย์ในการกำหนดข่าวสารเลียนแบบได้อย่างถูกต้อง

ในการค้นคว้าเมื่อเร็วๆนี้พบว่าสำเร็จรูปได้ถึง 76 เปอร์เซ็นต์ของเวลาเมื่อเทียบกับอัตราความสำเร็จของคนเราที่ 70 เปอร์เซ็นต์ ยิ่งไปกว่านี้ขั้นตอนการพินิจพิจารณาภาษาศาสตร์ของพวกเขาสามารถใช้เพื่อกำหนดบทความข่าวปลอมที่ใหม่เหลือเกินที่จะถูกหักล้างโดยการอ้างอิงผ่านกับความจริงอื่นๆ

Rada Mihalcea, 
ศาสตราจารย์ด้านวิทยาศาสตร์รวมทั้งวิศวกรรมของ U-M ที่อยู่เบื้องหลังโครงงานพูดว่าโซลูชันอัตโนมัติบางทีอาจเป็นเครื่องมือที่สำคัญสำหรับเว็บไซต์ที่กำลังมานะจัดแจงกับการโจมตีของข่าวเลียนแบบซึ่งมักสร้างขึ้นเพื่อสร้างการคลิกหรือเพื่อจัดการกับความคิดเห็นของ รับทำการตลาด ประชาชน

การจับหลักสำคัญเรื่องเลียนแบบก่อนจะส่งผลจริงอาจเกิดเรื่องยากเพราะเหตุว่าผู้เก็บรวมทั้งไซต์สื่อสังคมออนไลน์จะต้องอาศัยบรรณาธิการของผู้คนซึ่งมักไม่อาจจะติดตามเรื่องราวการไหลบ่า ยิ่งกว่านั้นแนวทางการหักล้างในปัจจุบันมักขึ้นกับการตรวจทานความจริงจากภายนอกซึ่งบางทีอาจเป็นเรื่องยากสำหรับเรื่องราวล่าสุด บ่อยครั้งเมื่อถึงเวลาที่เรื่องราวได้รับการรับรองแล้วว่าเป็นของปลอมแล้วความทรุดโทรมที่เกิดขึ้นได้กระทำไปแล้ว

การวิเคราะห์ภาษาศาสตร์ใช้ รับทำการตลาด กระบวนการที่ต่างกันการวิเคราะห์คุณสมบัติเชิงปริมาณยกตัวอย่างเช่นโครงสร้างทางไวยากรณ์การเลือกคำเครื่องหมายวรรคตอนรวมทั้งความสลับซับซ้อน ปฏิบัติงานได้เร็วกว่ามนุษย์แล้วก็สามารถใช้งานได้หลากหลายประเภทข่าวสารต่างๆ

คุณสามารถจินตนาการจำนวนของแอพพลิเคชั่นอันนี้ถึงที่เหมาะด้านหน้าหรือด้านหลังของข่าวหรือไซต์สื่อสังคมออนไลน์” Mihalcea กล่าว มันสามารถให้ผู้ใช้ประเมินความน่าไว้วางใจของแต่ละเรื่องหรือไซต์ข่าวสารทั้งผองหรือบางทีอาจเป็นบรรทัดแรกของการปกป้องในส่วนท้ายของไซต์ข่าวการตั้งค่าสถานะที่น่าสงสัยสำหรับเพื่อการตรวจตราเพิ่มเติมอัตราการบรรลุผล 76 เปอร์เซ็นต์ ใบขอบที่มีขนาดใหญ่เป็นธรรมของข้อผิดพลาด แม้กระนั้นก็ยังสามารถให้ข้อมูลเชิงลึกที่มีคุณค่าเมื่อมันใช้พร้อมกันไปกับมนุษย์. “

อั
ลกอริทึมภาษาศาสตร์ที่ใช้วิเคราะห์ รับทำการตลาด คำกล่าวเป็นลายลักษณ์อักษรคือเรื่องธรรดาธรรมดาในขณะนี้ Mihalcea กล่าว ความท้าในการสร้างเครื่องตรวจข่าวปลอมไม่ใช่อยู่ในการสร้างอัลกอริทึมเอง แม้กระนั้นในการหาข้อมูลที่ถูกสำหรับเพื่อการฝึกอบรมอัลกอริธึมนั้น


ข่าวปลอมปรากฏขึ้นแล้วก็หายไปอย่างเร็วซึ่งทำให้ยากต่อการรวบรวม นอกจากนี้ยังมีหลายหมวดหมู่ที่สลับซับซ้อนมากยิ่งขึ้นขั้นตอนเก็บรวบรวม ข่าวสารการเสียดสีอย่างเช่นเป็นเรื่องที่ไม่ได้ยากเย็นที่จะรวบรวม รับทำการตลาด แต่การใช้การประชดและความไร้เหตุผลทำให้ไม่ค่อยเป็นประโยชน์สำหรับในการฝึกหัดอัลกอริทึมเพื่อตรวจค้นข่าวเลียนแบบซึ่งก็คือการคดโกง


ทีมงานของ Mihalcea ได้สร้างข้อมูลของตัวเองสร้างทีมงานออนไลน์แบบถอยกลับซึ่งได้ตรวจสอบเรื่องราวข่าวแท้ที่ปลอมไว้เป็นของปลอมแล้ว นี่เป็นวิธีการสร้างข่าวสารปลอมที่แท้จริงสูงที่สุด Mihalcea กล่าวโดยบุคคลที่เขียนได้อย่างรวดเร็วเพื่อแลกเปลี่ยนกับเงินรางวัล

ผู้เข้ารับการศึกษาซึ่งได้รับการเลือกเฟ้นด้วยการช่วยเหลือของ Amazon Mechanical Turk ได้รับค่าแรงให้แปลงเรื่องราวในข่าวสั้นให้เป็นข่าวที่คล้ายกัน แต่ว่าเป็นของปลอมเอาอย่างแบบการเขียนข่าวสารของบทความ ในช่วงท้ายของกระบวนการทีมงานวิจัยมีชุดข้อมูลจริง 500 เรื่องและก็ข่าวเลียนแบบ

ต่อจากนั้นพวกเขาก็ป้อนข้อมูล รับทำการตลาด กลุ่มนี้ให้เป็นอัลกอริทึมที่ใช้ในการวิเคราะห์ภาษาศาสตร์โดยสอนตนเองให้มองเห็นความแตกต่างระหว่างข่าวสารจริงกับข่าวปลอม ท้ายที่สุดทีมงานได้เปลี่ยนอัลกอริทึมเป็นชุดข้อมูลจริงรวมทั้งข่าวเลียนแบบที่ดึงมาจากเว็บโดยตรงโดยคิดเป็นอัตราความสำเร็จ 76 เปอร์เซ็นต์


เนื้อหาของระบบใหม่รวมทั้งชุดข้อมูลที่ทีมใช้สำหรับในการสร้างนั้นใช้ได้อย่างอิสระและก็ Mihalcea กล่าวว่าพวกเขาสามารถใช้เว็บข่าวสารหรือหน่วยงานอื่นๆเพื่อสร้างระบบตรวจค้นข่าวของตนเองได้ เธอพูดว่าระบบในอนาคตบางทีอาจได้รับการชื่นชมเพิ่มอีกโดยการรวมเอาข้อมูลเมตายกตัวอย่างเช่นลิงก์รวมทั้งความเห็นที่เกี่ยวข้องกับรายการข่าวสารออนไลน์ที่กำหนดไว้

Facebook Comments