สิ่งตีพิมพ์ใหม่
เสียงเป็นการวิเคราะห์: สัญญาณเริ่มต้นของมะเร็งและรอยโรคที่ไม่ร้ายแรง
ตรวจสอบล่าสุด: 18.08.2025

เนื้อหา iLive ทั้งหมดได้รับการตรวจสอบทางการแพทย์หรือตรวจสอบข้อเท็จจริงเพื่อให้แน่ใจว่ามีความถูกต้องตามจริงมากที่สุดเท่าที่จะเป็นไปได้
เรามีแนวทางการจัดหาที่เข้มงวดและมีการเชื่อมโยงไปยังเว็บไซต์สื่อที่มีชื่อเสียงสถาบันการวิจัยทางวิชาการและเมื่อใดก็ตามที่เป็นไปได้ โปรดทราบว่าตัวเลขในวงเล็บ ([1], [2], ฯลฯ ) เป็นลิงก์ที่คลิกได้เพื่อการศึกษาเหล่านี้
หากคุณรู้สึกว่าเนื้อหาใด ๆ ของเราไม่ถูกต้องล้าสมัยหรือมีข้อสงสัยอื่น ๆ โปรดเลือกแล้วกด Ctrl + Enter

นักวิจัยจากมหาวิทยาลัย Oregon Health & Science University ได้วิเคราะห์บันทึกเสียงพูดจากชุดข้อมูล Bridge2AI-Voice ใหม่ที่เผยแพร่ต่อสาธารณะ และพบคุณลักษณะทางเสียงที่เรียบง่ายซึ่งสามารถเปิดเผยพยาธิสภาพของสายเสียงได้ เรากำลังพูดถึงอัตราส่วนฮาร์โมนิกต่อเสียงรบกวน (HNR) ซึ่งเป็นอัตราส่วนของ “เสียงดนตรีโอเวอร์โทน” ต่อเสียงรบกวน ระดับและความแปรปรวนของ HNR แยกแยะเสียงของผู้ที่เป็นมะเร็งกล่องเสียงและรอยโรคที่ไม่ร้ายแรงออกจากเสียงปกติและความผิดปกติของเสียงอื่นๆ ผลกระทบนี้เห็นได้ชัดเจนเป็นพิเศษในผู้ชายที่เป็นคนเพศเดียวกัน (Cisgender) แต่ความสำคัญทางสถิติยังไม่เพียงพอสำหรับผู้หญิง ผู้เขียนจึงตำหนิขนาดกลุ่มตัวอย่างที่เล็กและเรียกร้องให้มีการขยายข้อมูล งานวิจัยนี้ได้รับการตีพิมพ์เป็นรายงานสรุปในFrontiers in Digital Health
ความเป็นมาของการศึกษา
- ทำไมต้องมองหา "เครื่องหมายเสียง" กันด้วยล่ะ? เสียงแหบเป็นอาการที่พบได้บ่อย สาเหตุมีหลากหลาย ตั้งแต่หวัด กรดไหลย้อน ไปจนถึงก้อนเนื้อ/ติ่งเนื้อ และมะเร็งกล่องเสียง ปัจจุบันการวินิจฉัยทำได้โดยการไปพบแพทย์ผู้เชี่ยวชาญด้านหู คอ จมูก และการส่องกล้อง (กล้องในโพรงจมูก/ลำคอ) วิธีนี้แม่นยำ แต่อาจไม่สามารถทำได้อย่างรวดเร็ว และไม่เหมาะสำหรับการเฝ้าติดตามอาการด้วยตนเองที่บ้าน จำเป็นต้องมีการตรวจคัดกรองเบื้องต้น ซึ่งเป็นวิธีง่ายๆ ที่จะช่วยให้คุณเข้าใจว่าใครควรไปพบแพทย์ก่อน
- ไบโอมาร์กเกอร์เสียงคืออะไร? เสียงพูดเป็นสัญญาณที่สามารถบันทึกลงในโทรศัพท์ได้อย่างง่ายดาย “รูปแบบ” ของเสียงสามารถนำไปใช้ประเมินการสั่นสะเทือนของสายเสียงได้ รอยโรคทำให้การสั่นสะเทือนไม่สม่ำเสมอ มี “เสียงรบกวน” มากขึ้นและ “เสียงเพลง” น้อยลง
- เหตุใดชุดข้อมูลใหม่จึงมีความสำคัญก่อนหน้านี้ งานดังกล่าวอาศัยตัวอย่างขนาดเล็กที่ “สร้างขึ้นเอง” เนื่องจากแบบจำลองมีความเปราะบาง Bridge2AI-Voice เป็นชุดบันทึกเสียงขนาดใหญ่ที่รวบรวมจากหลายศูนย์อย่างมีจริยธรรม ซึ่งเชื่อมโยงกับการวินิจฉัย ชุดข้อมูลนี้ถูกสร้างขึ้นเพื่อเป็น “พื้นที่ทดสอบร่วม” เพื่อฝึกฝนและทดสอบอัลกอริทึมบนข้อมูลขนาดใหญ่และมีความหลากหลายในที่สุด
- ปัญหาหลักๆ อยู่ตรงไหน?
- เสียงจะเปลี่ยนไปเนื่องจากไมโครโฟน เสียงในห้อง ความเย็น การสูบบุหรี่ ภาษา เพศ และอายุ
- โดยทั่วไปแล้วจะมีข้อมูลของผู้หญิงน้อยกว่า และเสียงของผู้หญิงจะมีความถี่สูงกว่า ซึ่งตัวชี้วัดจะทำงานแตกต่างกัน
- ไม่มีการทดสอบแบบ “ที่บ้าน” ใดที่สามารถทดแทนการตรวจร่างกายหรือวินิจฉัยโรคได้ แต่ส่วนใหญ่จะช่วยให้ตัดสินใจได้ว่า “จำเป็นต้องพบแพทย์เฉพาะทางด้านหู คอ จมูก ด่วนหรือไม่”
- ทำไมคลินิกและผู้ป่วยจึงต้องการสิ่งนี้? หากสามารถเลือกผู้ที่มีความเสี่ยงสูงต่อการมีต่อมน้ำเหลืองหรือเนื้องอกให้เข้ารับการนัดหมายเร่งด่วนได้ภายในระยะเวลาสั้นๆ จะช่วยให้การวินิจฉัยรวดเร็วขึ้น ลดการส่งต่อผู้ป่วยที่ไม่จำเป็น และเป็นเครื่องมือสำหรับการติดตามอาการด้วยตนเองระหว่างการเข้ารับการรักษา (หลังผ่าตัด ระหว่างการรักษา)
- สิ่งนี้ควรนำไปสู่สิ่งใด: การตรวจสอบแอปพลิเคชัน/โมดูลเทเลเมดิซีนที่:
- เขียนคำกล่าวให้เป็นไปตามมาตรฐาน (วลี + ลากยาว “อ๊าาา”)
- คำนวณคุณสมบัติพื้นฐาน (HNR, jitter, shimmer, F0)
- ออกคำแนะนำให้ติดต่อผู้เชี่ยวชาญหากโปรไฟล์น่าตกใจ
- รักษาความคล่องตัวหลังการรักษา
แนวคิดนี้เรียบง่ายมาก: “ให้โทรศัพท์ไปที่หูของแพทย์หู คอ จมูก” – ไม่ใช่เพื่อการวินิจฉัย แต่เพื่อไม่ให้พลาดผู้ที่ต้องการความช่วยเหลือแบบพบหน้าอย่างรวดเร็ว
พวกเขาทำอะไรกันแน่?
- เราได้เผยแพร่ชุดข้อมูล Bridge2AI-Voice ที่รวบรวมตามหลักจริยธรรมจากหลายศูนย์เป็นครั้งแรก ซึ่งเป็นโครงการเรือธงของ NIH ที่มีการเชื่อมโยงกับการบันทึกเสียงทางคลินิก (การวินิจฉัย แบบสอบถาม ฯลฯ)
- ตัวอย่างวิเคราะห์ถูกสร้างขึ้น 2 ตัวอย่าง:
- “มะเร็งกล่องเสียง / ต่อมน้ำเหลืองชนิดไม่ร้ายแรง / สุขภาพดี”;
- "มะเร็งหรือก้อนเนื้อชนิดไม่ร้ายแรง" เทียบกับภาวะเสียงแหบแบบกระตุกและอัมพาตสายเสียง (สาเหตุทั่วไปอื่นๆ ของเสียงแหบ)
- ระบุลักษณะเสียงพื้นฐานจากวลีมาตรฐาน ได้แก่ โทนเสียงพื้นฐาน (F0) จิตเตอร์ ชิมเมอร์ และ HNR และเปรียบเทียบกลุ่มโดยใช้สถิติแบบไม่ใช้พารามิเตอร์ ผลการศึกษา: ความแตกต่างที่คงที่มากที่สุดคือ HNR และ F0 โดย HNR และความแปรปรวนของ HNR สามารถแยกรอยโรคที่ไม่ร้ายแรงออกจากมะเร็งปกติและมะเร็งกล่องเสียงได้ดีที่สุด สัญญาณเหล่านี้มีความชัดเจนมากขึ้นในผู้ชาย
เหตุใดสิ่งนี้จึงสำคัญ?
- การตรวจคัดกรองตั้งแต่เนิ่นๆ โดยไม่ต้องใช้อุปกรณ์ตรวจ ปัจจุบัน การวินิจฉัยมักใช้วิธีส่องกล้องทางจมูก และหากสงสัย ก็สามารถตัดชิ้นเนื้อได้ หากนำคุณสมบัติทางเสียงที่เรียบง่ายมาผสานกับ AI สามารถให้ความสำคัญกับผู้ที่จำเป็นต้องส่องกล้องได้ ผู้ป่วยจะได้รับการรักษาโดยแพทย์ผู้เชี่ยวชาญด้านหู คอ จมูก ได้เร็วขึ้น และลดการส่งต่อผู้ป่วยที่ไม่จำเป็นออกไป นี่เป็นเพียงส่วนเสริม ไม่ใช่การทดแทนแพทย์
- บิ๊กดาต้าสำหรับเสียง Bridge2AI-Voice เป็นโครงการที่หาได้ยากซึ่งใช้การรวบรวมข้อมูลเสียงโดยใช้โปรโตคอลที่เป็นมาตรฐานเดียวกันและเชื่อมโยงกับการวินิจฉัย โดยนักวิจัยสามารถเข้าถึงข้อมูลเหล่านี้ได้ผ่าน PhysioNet / Health Data Nexus วิธีนี้ช่วยเร่งการพัฒนาไบโอมาร์กเกอร์เสียงที่เชื่อถือได้ แทนที่จะใช้ "แอปพลิเคชันมหัศจรรย์" กับตัวอย่างขนาดเล็ก
HNR คืออะไร?
เมื่อเราพูด สายเสียงจะสั่นสะเทือนและสร้างเสียงโอเวอร์โทน (ฮาร์โมนิก) แต่การสั่นสะเทือนนั้นไม่เคยสมบูรณ์แบบ เพราะสัญญาณมักมีเสียงรบกวนอยู่เสมอ HNR เป็นเพียงเสียงที่มี "ดนตรี" มากกว่า "เสียงฟ่อ" ในเสียงพูด เมื่อสายเสียงเสียหาย การสั่นสะเทือนจะไม่สม่ำเสมอ มีเสียงรบกวนมากขึ้น เสียง HNR ตกลง และกระโดด (ความแปรปรวน) จะเพิ่มขึ้น นี่คือรูปแบบที่ผู้เขียนได้บันทึกไว้
ข้อสงวนสิทธิ์ที่สำคัญ
- นี่คือการวิเคราะห์เชิงสำรวจนำร่อง โดยไม่มีการตรวจสอบทางคลินิก และมีข้อจำกัดเกี่ยวกับกลุ่มตัวอย่างผู้หญิง ดังนั้นผลกระทบจึงไม่มีนัยสำคัญ จำเป็นต้องมีข้อมูลขนาดใหญ่และหลากหลายมากขึ้น รวมถึง "การคั่ว" แบบจำลองในคลินิกต่างๆ และในภาษาต่างๆ
- เสียงเป็นสิ่งที่มี "หลายค่า": เสียงจะได้รับผลกระทบจากอาการหวัด ควันบุหรี่ กรดไหลย้อน ไมโครโฟน และเสียงในห้อง "การทดสอบที่บ้าน" ใดๆ ควรคำนึงถึงบริบท และยังคงทำหน้าที่เป็นตัวกรองสำหรับการส่งต่อผู้ป่วยไปยังผู้เชี่ยวชาญด้านหู คอ จมูก ไม่ใช่การวินิจฉัยแบบคลิกผ่าน
ต่อไปจะเป็นยังไง?
- ขยายชุดข้อมูล (รวมถึงสำหรับผู้หญิงและอายุ) กำหนดมาตรฐานงานและเสียง (การอ่านวลี เสียง "aaa" ที่ยาวนาน ฯลฯ) ลองใช้โมเดลหลายโหมด (เสียง + อาการ/ปัจจัยเสี่ยงจากแบบสอบถาม)
- เชื่อมโยงสัญญาณอะคูสติกกับผลการตรวจ (ส่องกล้อง, สโตรโบสโคปี) และไดนามิกหลังการรักษา เพื่อให้สามารถใช้โปรไฟล์ HNR สำหรับการตรวจติดตามได้ด้วย
- ดำเนินการ “วิทยาศาสตร์แบบเปิด” ต่อไป: Bridge2AI-Voice กำลังเผยแพร่ชุดข้อมูลและเครื่องมือเวอร์ชันต่างๆ อยู่แล้ว ซึ่งถือเป็นโอกาสที่จะเข้าถึงกลุ่มนักบินจริงในคลินิกได้อย่างรวดเร็ว
บทสรุป
เป็นไปได้ที่จะ "ได้ยิน" ปัญหาเกี่ยวกับสายเสียงจากเสียง — และอาจส่งตัวผู้ป่วยไปพบผู้เชี่ยวชาญที่เหมาะสมได้เร็วขึ้น ในตอนนี้ มันยังเป็นเพียงสัญญาณบ่งชี้ (HNR และความแปรปรวนของมัน) แต่ด้วยข้อมูลเปิดขนาดใหญ่ ในที่สุดไบโอมาร์กเกอร์เสียงก็มีโอกาสที่จะกลายเป็นเครื่องมือคัดกรองที่เชื่อถือได้
ที่มา: Jenkins P. และคณะVoice as a Biomarker: การวิเคราะห์เชิงสำรวจสำหรับรอยโรคที่เส้นเสียงชนิดไม่ร้ายแรงและ ชนิดร้าย Frontiers in Digital Health, 2025 (ได้รับการยินยอมให้ตีพิมพ์) ข้อมูล — Bridge2AI-Voice (NIH/PhysioNet)