นักวิจัยได้ทำการทดลองโดยเอาไมโครโฟนไปต่อใกล้กับหน้าจอพบว่ามีการปล่อยสัญญาณเสียงที่มีลักษณะเฉพาะกับการแสดงผลในลักษณะต่างๆ ซึ่งสามารถนำไปประยุกต์ใช้ในการโจมตีเพื่ออ่านเนื้อหาที่กำลังแสดงผลอยู่ได้
ผลการศึกษาสัญญาณเสียงจากหน้าจอ LCD (รวม CCFL และ LED ด้วย) พบว่าเสียงที่ปล่อยออกมานั้นมีการเชื่อมต่อกับภาพที่แสดงออกมาและมีลักษณะเป็นเอกลักษณ์ด้วย อันที่จริงแล้วมันเกิดจากตัวจ่ายไฟของหน้าจอที่ส่งสัญญาณเสียงโทนสูงขณะกำลังจ่ายไฟและจะแตกต่างกันไปตามการใช้ไฟเพื่อแสดงผลและแม้ว่ามนุษย์จะไม่ได้ยินแต่สำหรับไมโครโฟนจะสามารถบันทึกได้ โดยหลังจากที่นำมาวิเคราะห์ดูนักวิจัยก็ได้พบความแตกต่างที่สามารถจดจำเนื้อหาที่แสดงอยู่ได้ (มีเอกลักษณ์ว่าเสียงแบบนี้ควรจะแสดงผลอะไร)
อย่างไรก็ตามหากคิดในมุมมองของผู้โจมตีจำเป็นต้องมีการระบุก่อนว่าสนใจเนื้อหาอะไร เช่น รูปหรือข้อความและต้องมีการเทรนนิ่งโมเดลของ Machine Learning ที่จะรู้ถึงรูปแบบที่ต้องการได้อย่างอัตโนมัติ โดยในส่วนของตำแหน่งจุดวางตัวไมโครโฟนในงานวิจัยกล่าวว่า “ตำแหน่งวางไมโครโฟนที่ดีตัวอย่างเช่น ซ่อนไว้ใน Webcam ซึ่งปกติแล้วคนจะวางใกล้กับหน้าจอในการใช้งาน” นอกจากนี้นักวิจัยได้ทดสอบวิธีการอื่นในการจับสัญญาณเสียงจากส่วนแสดงผลอีกด้วยและพบว่าสามารถใช้สมาร์มโฟนหรือ Smart Virtual Assistant (Amazon Alexa และ Google Home) ที่วางอยู่ใกล้กับหน้าจอ ดังนั้นวิธีการนี้ไม่จำเป็นต้องวางตัวไมโครโฟนติดกับหน้าจอมากนัก
ผลลัพธ์ของการทดลองจากการจำจองสภาพแวดล้อมจริง เช่น มีเสียงรบกวนจากคนหรืออุปกรณ์อิเล็กทรอนิกส์อื่น โจทย์คือมีเอกลักษณ์เฉพาะของเว็บไซต์จำนวน 97 เว็บจำลองให้ผู้โจมตีระบุว่าเว็บไหนกำลังแสดงผลอยู่ ผลปรากฎว่ามีค่าความผิดพลาดประมาณ 8% สำหรับการโจมตีในระยะประชิดและการใช้โทรศัพท์เพื่อโจมตี ในขณะที่มีค่าความผิดพลาดเพิ่มหากระยะทางเพิ่มขึ้น ในส่วนของความแม่นยำพบว่าทำได้ 97% ในการวางตัวบันทึกที่ระยะใกล้และ 90.9% ที่ระยะไกลออกไป ในการทดลองแกะตัวอักษรออกมาเพื่อทราบถึงข้อมูลจริงสามารถทำได้หากเป็นฟอนต์ขนาดใหญ่โดยมีความแม่นยำระหว่าง 88-98% ผู้สนใจสามารถติดตามเพิ่มเติมได้ที่นี่