การวิเคราะห์ข้อความทั่วโลกช่วยทุกคนทุกธุรกิจให้รอดพ้นจากโควิด-19 ได้อย่างไร

การวิเคราะห์ข้อความทั่วโลกช่วยทุกคนทุกธุรกิจให้รอดพ้นจาก โควิด-19 ได้อย่างไร

ในช่วงเวลาโรคระบาดระดับโลกอย่างโควิด 19 ก่อกำเนิดขึ้นอย่างลึกลับและแพร่กระจายไปทุกหนทุกแห่งอย่างรวดเร็ว
คุณเคยคิดไหมว่า คุณสามารถใช้ความรู้ ทักษะ หรือความเชี่ยวชาญอะไรที่มีของคุณ เพื่อช่วยยับยั้งการแพร่กระจายของเชื้อโรคปริศนานี้ ไม่ว่าคุณจะเป็นใครหรือทำอาชีพอะไร คุณได้เป็นส่วนหนึ่งที่สามารถหยุดยั้งมันได้แล้ว นับตั้งแต่โรคระบาดนี้กระจายไปรวดเร็วอย่างพริบตาและพัฒนาอย่างไม่หยุดยั้งไม่หยุดหย่อน

นับตั้งแต่จุดกำเนิดของโรคร้ายตัวนี้ หลากหลายผู้คนต่างมีความคิดและเห็นความรู้สึกต่อโรคนี้แตกต่างกันอย่างมากตามประสบการณ์ชีวิตของแต่ละคนและสัญชาตญาณ บ้างก็มองว่าโรคนี้ไม่อันตรายเป็นเพียงไข้หวัดธรรมดา บ้างก็มองว่าโรคนี้เกิดจากฝีมือธรรมชาติที่ต้องการลงโทษมนุษย์ บ้างก็ตื่นตระหนกและหวาดกลัวจนไม่กล้าใช้ชีวิต บ้างก็ตั้งหน้าตั้งตาศึกษาหาต้นตอและวิธีรักษา จึงสามารถสรุปได้ว่าโควิด 19
ได้เข้ามาส่งผลกระทบกับความคิดและพฤติกรรมของคนทั่วโลกอย่างหลีกเลี่ยงไม่ได้ ทุกคนต้องหาหนทางเผชิญกับมัน และใช้ชีวิตร่วมกับมันจนกว่าจะหาหนทางรักษาได้

ข้อมูลข่าวสารคือจุดเปลี่ยนสำคัญต่อการรับมือภัยพิบัติ

กว่า 2 ปีีที่โลกตกอยู่ในยุคแห่งความหม่นหมองไม่แน่นอน นับว่าเป็นช่วงเวลาที่ยาวนานและร้ายแรงในการเผชิญหน้ากับมหันตภัยที่ไร้ตัวตน และสิ่งที่ตามหลอกหลอนมนุษยชาตินับตั้งแต่ยุคหินที่ไม่สามารถหลีกเลี่ยงได้คือ กลัวความไม่รู้ (fear of the unknown) และในการรับมือของผู้คนแต่ละยุคแต่ละสมัยก็แตกต่างกัน ในยุคกรีกโรมันผู้คนก็จะอธิบายปรากฏการณ์ที่ลึกลับด้วยการสร้างนานาเทพแห่งขุนเขาโอลิมปัสขึ้นมาว่าเป็นฝีมือของพวกเขาที่บันดาลสิ่งต่างๆ ในสังคมที่มีความเชื่อที่แตกต่างออกไปก็จะสร้างเทพพระเจ้าที่มีรูปแบบแตกต่างกัน อย่างการล่าแม่มดก็เป็นโศกนาฏกรรมที่เกิดจากความไม่รู้และพยายามหาสาเหตุของอาเพศบ้านเมืองนานาที่เกิดขึ้น จุดประสงค์ทั้งหมดเหล่านี้คือเพื่อรับมือกับความไม่รู้ (fear of the unknown) ให้ผู้คนอยู่ในความสงบในอดีตหลายร้อยหลายหมื่นปีีมาแล้ว

ในยุคที่มีวิทยาศาสร์เข้ามามีบทบาทมากขึ้น นักวิทยาศาสตร์ทั้งหลายก็พยายามอธิบายปรากฏการณ์ที่เกิดขึ้นบนโลกด้วยหลักวิทยาศาสตร์ มีการทดทอง การสังเกตการณ์ การพิสูจน์ซ้ำแล้วซ้ำอีกเพื่อสรุปมาเป็นกฎและทฤษฎีต่างๆ เกิดเป็นวิทยาศาสตร์สาขามากมาย จนมาถึงวิทยาศาตร์ข้อมูล (Data Science) ที่พยายามจะอธิบายสิ่งที่เกิดขึ้นรอบตัวจากข้อมูล ไม่ว่าจะเป็นทางการแพทย์ ทางธรรมชาติ ทางธุรกิจ จะเรียกได้ว่าวิทยาศาตร์ข้อมูลกลายเป็นหนึ่งในจุดสำคัญที่ขับเคลื่อนโลกของเราสู่ยุคใหม่อย่างแท้จริง

เมื่อก่อนข้อมูลข่าวสารมักจะเป็นเรื่องเล่ารุ่นสู่รุ่น บันทึกอยู่ในหิน ใบไม้ ด้วยภาษาที่สื่อสารกัน ทำให้ตำนานและประวัติศาสตร์ยังคงสืบทอดมาสู่ยุคปัจจุบัน ไม่ว่าจะเป็นเกี่ยวกับเทพกรีก เทพโรมัน เทพมายา เทพนอร์ส หรือศาสนาต่างๆ ที่เกิดมาเพื่อให้มนุษย์ทั้งหลายเกิดความสงบสุขทางจิตใจและรับมือกับความไม่รู้ของพวกเรา บางศาสนายังคงเป็นที่นับถือในคนหมู่มาก บางศาสนาหรือเทพพระเจ้าบางองค์ก็ยังเป็นที่นับถือในกลุ่มคนที่เล็กอยู่ รวมถึงแนวคิดทางวิทยาศาสตร์หรือปรัชญาแนวคิดต่างๆที่ช่วยให้มนุษย์อยู่รอดกับความไม่รู้ ความไม่แน่นอนของชีวิต ทั้งหมดนี้ถ่ายทอดและบันทึกด้วยภาษาเป็นส่วนมาก

ข่าวสารและข้อมูลในยุคอินเตอร์เน็ตที่ผู้คนสามารถถ่ายทอดบอกเล่าข้อมูลต่างๆลงบนโลกออนไลน์ได้ มันทำให้เกิดแหล่งข้อมูลข่าวสารเกี่ยวกับโรคโควิด 19 มากมายทุกวินาทีและทุกมุมโลก ทุกคนต่างมีมุมมอง ความรู้ และทฤษฎีที่แตกต่างกันไปและมันกระจัดกระจายอยู่ทั่วโลก สังคมได้ข้อมูลข่าวสารไปแบบไหนก็จะมีการรับมือที่แตกต่างกันไป มันทำให้เกิดปัญหาที่แตกต่างกันบ้างรับมือสำเร็จ บ้างก็ล้มเหลว เพราะปัจจัยหนึ่งในนั้นคือได้ใช้ประโยชน์จากข้อมูลข่าวสารที่ถูกต้องและน่าเชื่อถือนั้นหรือไม่

NLP (Natural Language Processing) ศาสตร์ที่เป็นผู้ปิดทองหลังพระ

เมื่อข่าวสารเกิดขึ้นมากมายจากหลายแหล่งข้อมูลจึงเป็นเหมือนปัญหาสำคัญของทุกอาชีพที่มีอิทธิพลในการรับมือโควิด 19 อีกทั้งเวลาที่บีบคั้นเพราะการแพร่กระจายที่รวดเร็วต้องทำงานแข่งกับเวลาตลอด เพราะความเป็นความตายของผู้คนมากมายฝากไว้กับผู้ที่มีความรู้ความสามารถที่จะทำความเข้าใจกับโรคที่ไม่เคยมีใครเข้าใจมาก่อน

การตัดสินใจในกลยุทธนั้นสมัยก่อนอาจจะใช้ประสบการณ์จากผู้เชี่ยวชาญ หรือถ้าหมดหนทางก็ต้องใช้สัญชาตญาณ (Gut feeling) ในการตัดสินใจเรื่องใดเรื่องหนึ่ง การตัดสินใจด้วยข้อมูลนั้นก็ถือว่าเป็นการลดความเสี่ยงได้ระดับหนึ่ง แต่สมัยที่มีข้อมูลมากมายก็เกิดปัญหา ถ้าคนกลุ่มหนึ่งเลือกที่จะเชื่อข้อมูลจากแหล่งใดแหล่งหนึ่งและตัดสินใจด้วยข้อมูลเท่าที่มีเพียงแหล่งเดียว และถ้าข้อมูลที่ได้รับมาไม่ถูกต้องหรือไม่มีความน่าเชื่อถือมากพอ แทนที่จะส่งผลดีต่อการตัดสินใจ มันอาจจะเป็นดาบสองคมที่กลับเข้ามาทำร้ายทุกอย่างเสียเอง

ในการพัฒนาวัคซีนรักษาโรคนั้นจะมีประสิทธิภาพมากน้อยแค่ไหน ขึ้นอยู่กับความรู้และทฤษฎีที่ผู้พัฒนาวัคซีนได้ศึกษามา เมื่อข้อมูลเกี่ยวกับโควิด 19 มันเกิดขึ้นมากมาย ทั้งงานวิจัยทางการแพทย์ในอดีตทั้งงานวิจัยที่เพิ่งเกิดขึ้นมาใหม่ได้กระจัดกระจาย โดยไม่รู้ว่าใครคนใดบ้างที่พยายามพัฒนาความรู้เพื่อการรักษาโรคร้ายนี้

การพยายามรวบรวมข้อมูลเกี่ยวกับโควิด 19 และความรู้ที่เกี่ยวข้องอย่างรวดเร็วจึงเป็นคันเร่งสำคัญที่จะทำให้การพัฒนาวัคซีนที่มีประสิทธิภาพเกิดขึ้นได้ Natural Language Processing หรือ NLP จึงเป็นความรู้ที่สำคัญที่มีหน้าที่นำข้อมูลต่างๆที่เป็นข้อความมาผ่านการวิเคราะห์เป็นตัวเลข และหาความสัมพันธ์ของวิจัย บทความ ข้อความบนโลกโซเชียลที่เป็นความรู้ใหม่ๆที่สามารถจะช่วยพัฒนาวัคซีนให้มีประสิทธิภาพ หรือแม้กระทั่งลดกระบวนการทดสอบบ้างอย่างไปได้

หากจะอธิบายในความยากของการทำ Natural Language Processing (NLP) ก็คือข้อมูลประเภทข้อความเป็นข้อมูลแบบไม่มีโครงสร้างแน่นอน (unstructured data) การวิเคราะห์โดยไม่ผ่านกระบวนการของ Natural Language Processing แทบจะเป็นไปไม่ได้เลย จึงต้องใช้ความรู้เหล่านี้แปลงข้อมูลเป็นตัวเลขและง่ายต่อการวิเคราะห์และการนำไปแสดงเป็นกราฟต่างๆเพื่อให้ผู้ตัดสินใจได้ข้อมูลความรู้ที่ถูกต้องและน่าเชื่อถือ มีตัวอย่างกราฟแผนที่ที่แสดงที่มาของข้อมูลเกี่ยวกับความรู้ทางการแพทย์เกี่ยวกับโควิด 19 ทั้งบทความ ทั้งผลการทดลองทางคลินิกที่เกิดขึ้นแล้วนำไปสู่ Collective Wisdom ที่ช่วยในการพัฒนาวัคซีนได้อย่างมาก สามารถเข้าไปดูตัวอย่างการนำ Natural Language Processing (NLP) มาสร้างกราฟได้ที่ https://covid19.linguamatics.com/

NLP (Natural Language Processing) ผู้หยุดยั้งการแพร่กระจายโรค

อีกหน้าที่หนึ่งที่จะรับมือกับโควิด 19 ได้นั้นคือการชะลอการระบาดระหว่างในการรอวัคซีนที่กำลังพัฒนาอยู่นั้นเอง ข้อมูลที่ประเทศเราได้รับส่วนใหญ่จะเป็นวิธีการดูแลตัวเองเบื้องต้นเพื่อชะลอการแพร่กระจายของโรคร้ายกับยอดตัวเลขต่างๆ แต่ตัวอย่างการใช้ความรู้ทางด้าน Natural Language Processing (NLP) ที่เป็นตัวช่วยสำคัญในการชะลอการแพร่ระบาดและการคาดการณ์จำนวนของผู้ที่ติดเชื้อเป็นตัวอย่างจากสหรัฐอเมริกา U.S. Health System ที่สามารถใช้ Natural Language Processing (NLP) ในการตรวจจับข้อความและอีเมลล์ของทางศูนย์รับมือโควิดของที่นั้น และใช้ข้อมูลเหล่านั้นประกอบกับข้อมูลพื้นที่ ข้อมูลการกระจายตัวของโรค นำมาวิเคราะห์เพื่อหาแนวโน้มของคนที่มีโอกาสติดเชื้อ ทำให้ทางสาธารณะสุขมีข้อมูลที่เพียงพอและแม่นยำในการรองรับผู้ป่วย หรือการออกมาตรการต่างๆที่เหมาะสม

นอกจากการรับมือกับผู้ที่ติดต่อนับล้านที่เข้ามาขอความช่วยเหลือจากศูนย์กลางการรับมือได้อย่างดีด้วย Natural Language Processing (NLP) แล้ว ความรู้สาขานี้ยังสามารถนำไปประเมินพื้นที่ความเสี่ยงของแต่ละพื้นที่ได้จากโซเชียลมีเดียของประชาชนด้วย เพราะเมื่อประชาชนโพสเกี่ยวกับการเจอคนติดโรค การไปโรงพยาบาล หรือการโพสข้อมูลต่างๆที่อยู่ในแต่ละพื้นที่

ก็สามารถนำข้อมูลเหล่านั้นมาวิเคราะห์เพื่อประเมินการณ์กระจายตัวของโรคและความเสี่ยงในแต่ละพื้นที่ได้เช่นกัน รวมไปถึงยังมีการสร้างอัลกอริทึมที่สามมารถติดตามข่าวสารต่างๆที่เกี่ยวกับวัคซีนในด้านประสิทธิภาพของความปลอดภัย และยังมีการเผยแพร่ข้อมูลเหล่านั้นให้เข้าถึงฟรีอย่างเช่นเว็บไซต์ Copyright Clearance Center COVID-19 collection. เพื่อให้นักวิชาการ หรือนักวิทยาศาสตร์ บุคคลากรทางด้านการแพทย์ หรือผู้ที่ต้องการรับวัคซีนเข้าถึงข้อมูลที่มีความน่าเชื่อถือนำไปวิเคราะห์ต่อยอดได้อีกด้วย

อนาคตในการรับมือโรคร้ายใหม่ด้วย NLP (Natural Language Processing)

Will Douglas Heaven ได้เขียนอธิบายใน MIT Technology Review ถึงการใช้ความรู้ทางด้าน Natural Language Processing (NLP) ประยุกต์กับความรู้ทางด้านชีววิทยาและได้อธิบายถึงการประยุกต์ครั้งนี้ได้ชัดเจนว่า “กาลิเลโอได้สังเกตการณ์ธรรมชาติรอบตัวและอธิบายสิ่งเหล่านั้นด้วยเลข และนักชีววิทยาได้อธิบายเป็นคนอธิบายเป็นคำพูด (ข้อความ)”

ในบทความได้ยกตัวอย่างประโยคในชีวิตประจำวันเทียบกับการวิเคราะห์การพัฒนาตัวของไวรัสหรือเชื้อโรคต่างๆ ผมจึงขอยกตัวอย่างให้มันเข้ากับบริบทในประเทศไทยดังนี้ “คนไทยชอบกินข้าวหอมมะลิ” “คนไทยชอบทานข้าวหอมมะลิ” “คนไทยชอบสูบข้าวหอมมะลิ” จากตัวอย่างนี้จะเห็นได้ว่าทางภาษานั้นถ้าจัดกลุ่มคำนวณก็อาจจะอยู่ในกลุ่มเดียวกัน เพราะมีโครงสร้างประธาน กริยา กรรมเรียงเหมือนกันหมด แต่เปลี่ยนแค่เพียงหนึ่งคำความหมายก็เปลี่ยนไปได้ทันที นั้นก็เหมือนกับเชื้อไวรัสที่มีโครงสร้างเหมือนกันแต่เพียงแค่เปลี่ยนไปส่วนหนึ่งก็สามารถทำให้ความรุนแรงเปลี่ยนแปลงได้

จุดมุ่งหมายของการศึกษาประยุกต์ Natural Language Processing (NLP)  คือชีววิทยาก็มีภาษาที่เป็นเอกลักษณ์ของมันเช่นกัน การหาโครงสร้างของเชื้อแต่ละประเภท ไวรัสแต่ละประเภท แบคทีเรียแต่ละประเภทแล้วจัดกลุ่มให้เห็นเป็นภาพชัดเจนจะทำให้เข้าใจโรคที่เกิดขึ้นมาใหม่ได้มากขึ้น เพื่อหาแนวทางในการรับมือและพัฒนาวัคซีนได้อย่างรวดเร็วและมีประสิทธิภาพ

นอกจากการรักษาและป้องกันการเผยแพร่แล้วยังมีการนำ NLP (Natural Language Processing) เพื่อไปวิเคราะห์กับผลกระทบที่จะตามมาหลังจากสามารถควบคุมโรคโควิด 19 ได้ เพราะโรคระบาดนี้ได้สร้างความเสียหายมากกว่าทางกายของมนุษย์ ด้วยการเว้นระยะห่าง การแยกตัวอยู่ในบ้าน การเพิ่มจำนวนของผู้ตกงาน เศรษฐกิจที่ชะลอตัวทำให้ส่งผลกระทบกับสุขภาพทางจิตของผู้คนมากมาย ทางผู้เชี่ยวชาญสาขา NLP (Natural Language Processing) จึงพยายามพัฒนาอัลกอริทึมที่สามารถลดความเสี่ยงในการฆ่าตัวตายที่เป็นผลมาจากโรคระบาดครั้งนี้เช่นกัน

ข้อความเกิดขึ้นตลอดเวลาทั้งจริงและเท็จทางออกคือ NLP

NLP (Natural Language Processing) เปรียบได้ว่าเป็นหนึ่งใน Avenger ที่ช่วยมนุษยชาติไว้ แม้ว่าจะไม่ได้โผล่มาให้เห็นในจอ ในข่าว ในหนังแยกอย่างตัวละครหลักอย่างกัปตันอเมริกา ไอรอนแมน หรือธอร์ แต่ผู้คนในวงการ NLP (Natural Language Processing) ก็ใช้ความเชี่ยวชาญของเขาประยุกต์ร่วมกับนักชีววิทยา นักระบาดวิทยา นักวิทยาศาตร์ทางการแพทย์ รวมถึงนักบริหารทางเทคโนโลยี เพื่อเป็นกุญแจสำคัญในการยับยั้งภัยยิ่งใหญ่ครั้งนี้ได้ ผู้เชี่ยวชาญทาง NLP (Natural Language Processing) จะเป็นคนที่รวบรวม คัดกรอง วิเคราะห์ข้อความมหาศาลจากทั่วโลกเพื่อให้ทุกฝ่ายที่เกี่ยวข้องร่วมกันสร้างแผนรับมือที่ดีที่สุด

คณะสถิติประยุกต์ ได้เห็นความสำคัญของการนำข้อมูลประเภทข้อความที่มีมหาศาลที่เชื่อมโยง และเกี่ยวข้องกับทุกสาขาความรู้ ทุกธุรกิจในทุกอุตสาหกรรม จึงได้นำเสนอหลักสูตรสาขาการวิเคราะห์ข้อมูลและวิทยาการข้อมูล Data Analytics and Data Science (DADS) ที่มีการสอน NLP (Natural Language Processing) ตั้งแต่การทำความเข้าใจหลักการเบื้องต้น การเปลี่ยนจากข้อความเป็นข้อมูลประเภทตัวเลข เพื่อทำการวิเคราะห์และการอัลกอริทึมต่างๆในการแก้ปัญหาต่างๆที่เกิดขึ้นในบริบทต่างๆ และได้ลงมือสร้างอัลกอริทึ่มจริงเพื่อให้เข้าใจในหลักการของ NLP (Natural Language Processing)

หากผู้ใดสนใจติดตามบทความการนำความรู้ทางด้าน Data Science ที่นำมาประยุกต์กับอุตสาหกรรมต่างๆสามารถติดตามแฟนเพจของสาขา DADS ได้ที่ Facebook Business Analytics and Data Science, GSAS, NIDA และสามารถติดตามแฟนเพจของคณะสถิติประยุกต์ Facebook GSAS NIDA เพื่อติดตามข่าวสารการนำความรู้ของสาขาอื่นๆในคณะที่มาประยุกต์ใช้ในธุรกิจได้เช่นกัน ถ้าหากสนใจหลักสูตรเพิ่มเติมสามารถติดต่อสอบถามได้ทุกช่องทางที่ให้ไว้ และสามารถสอบถามรายละเอียดต่างๆเพิ่มเติมได้ที่ช่องทาง เบอร์โทร 0949291944 หรือ Line Official Account

Credit Photo by : https://unsplash.com/

 

 

เขียนโดย:

นายคเณศ ประกอบแก้ว
นักศึกษาปริญญาโท ภาคพิเศษ หลักสูตรการวิเคราะห์ธุรกิจและวิทยาการข้อมูล
สาขาวิทยาการข้อมูล (Data Science : DS)

เปิดรับสมัครปริญญาโท ภาคพิเศษ

บัดนี้ - 25 กันยายน 2564
Share on facebook
Facebook
Share on twitter
Twitter
Share on linkedin
LinkedIn