A Little Book of BIG DATA and Machine Learning ดร.เอกสิทธิ์ พัชรวงศ์ศักดา

หนังสือ A Little Book of BIG DATA and Machine Learning ของ ดร.เอกสิทธิ์ พัชรวงศ์ศักดา เล่มนี้เหมาะกับคนที่พอจะมีความรู้ความเข้าใจเรื่อง Data มาในระดับหนึ่ง เหมาะกับคนที่เข้าใจภาพรวมแบบกว้างๆ เช่นนักการตลาดแบบผมที่อยากจะเข้าใจเชิงลึกลงบ้างอีกนิดหน่อยว่าโดยเทคนิคและวิธีการแล้วมีอะไรบ้าง แต่สิ่งหนึ่งที่บอกได้เลยคือแม้หน้าปกอาจจะดูมีความขึงขังจริงจังไปนิดสำหรับนักการตลาด(เช่นผม) แต่พอได้อ่านเนื้อหาข้างในแล้วรู้สึกเลยว่าสมูทมาก แทบไม่มีสะดุดเพราะ ดร.เอกสิทธิ์ เขียนอธิบายบรรดาเทคนิคทั้งหลายไว้อย่างดีผ่านการเล่าเรื่องเทียบกับชีวิตประจำวันใกล้ตัว ดังนั้นนี่เป็นหนังสือด้าน Big Data อีกหนึ่งเล่มที่อยากแนะนำให้คนที่พอมีพื้นดีและรู้คอนเซปในวงกว้างอยู่แล้วได้ลองหาอ่านดูครับ

ถ้าเปรียบนักการตลาดหรือเจ้าของธุรกิจเป็นสถาปนิกนักออกแบบอาคาร หนังสือเล่มนี้ก็เหมือนการให้ความรู้ในฝ่ายวิศวกรรมว่ากว่าจะเป็นตึกสวยงามได้นั้นต้องประกอบด้วยอะไรบ้าง หนังสือเล่มนี้จะทำให้เราเข้าใจเทคนิคหรือศัพท์แสงที่จะเอาไว้คุยกับ Data Scientist หรือ Dev ได้ลื่นขึ้นเวลาต้องทำโปรเจคร่วมกัน เชื่อมั้ยครับว่าการเข้าใจกันและกันว่าแต่ละฝ่ายทำงานอย่างไรคือหัวใจสำคัญของการทำให้โปรเจคเป็นไปอย่างราบรื่นเลยทีเดียว

หนังสือเล่มนี้แบ่งออกเป็น 6 บทใหญ่ที่เต็มไปด้วยภาพประกอบมากมาย เรียกได้ว่าอ่านแล้วไม่อึดอัด ไม่รู้สึกงง แล้วก็ไม่ได้ยากจนไม่เข้าใจสำหรับนักการตลาดที่พอเข้าใจเรื่อง Data มาบ้างครับ

สิ่งที่ผมชอบในหนังสือเล่มนี้คือการอธิบายว่า 5G หรือ 6G นั้นสำคัญอย่างไรกับชีวิตประจำวันของเรา หลายคนอาจนึกภาพไม่ออกว่าการที่อินเทอร์เน็ตเร็วขึ้นมากๆ แล้วยังไง เราจะดูหนัง HD ได้เร็วขึ้นเป็น 4K อย่างนั้นหรอ แต่ในความเป็นจริงแล้วอินเทอร์เน็ตที่เร็วขึ้นส่งผลต่อการใช้ชีวิตพื้นฐานเราทุกด้าน และในด้านหนึ่งที่สำคัญมากก็คือรถยนต์ที่วิ่งเองได้ หรือ self driving แบบ Tesla นั่นเองครับ

5G สู่วิถีชีวิตใหม่ที่ขาดเน็ตเหมือนขาดใจ

5G technology will radically make driverless cars more efficient | by  Revolutionary Entrepreneur | Revolutionary Entrepreneur | Medium

ต้องบอกว่าการที่รถยนต์จะสามารถวิ่งด้วยตัวเองโดยไม่ชนกับรถข้างๆ หรือคนเดินตัดหน้าได้นั้นต้องใช้การรับข้อมูลรอบตัวที่ไหลผ่านเข้ามาอย่างมหาศาล จากนั้นก็ต้องส่งออกไปประมวลผลเพื่อให้รถยนต์เข้าไปว่ารอบตัวในแต่ละเสี้ยววินาทีนั้นมีอะไร ควรต้องเร่งคามเร็วขึ้นอีกนิด หรือเบรกกระทันหัน และจากการเอา Data รอบรถทั้งหลายมาประมวลผลก็ต้องใช้ความสามารถในการประมวลผลที่มหาศาล ซึ่งนั่นก็หมายความว่าถ้ารถยนต์คันนั้นไม่มี CPU หรือ หน่วยประมวลผลที่แรงมากๆ ในตัวรถต้องส่งขึ้น Cloud ไปประมวลผลนั่นเอง

และการส่ง Data จำนวนมหาศาลขึ้นไปประมวลผลแล้วต้องได้รับข้อมูลป้อนกลับมาเพื่อให้ระบบใช้ตัดสินใจภายในเสี้ยววินาทีนั่นเองที่อินเทอร์เน็ตความเร็วสูง 5G หรือ 6G สำคัญมาก นั่นส่งผลต่อว่าถ้าพื้นที่ไหนอินเทอร์เน็ตไม่แรงพอหรือ 5G ไม่ครอบคลุมก็จะทำให้รถยนต์ขับเคลื่อนด้วยตัวเองเกิดปัญหาได้

เป็นอย่างไรครับกับตัวอย่างความสำคัญของ 5G ที่ทำให้เราเข้าใจภาพได้ง่ายๆ ว่าเราจะ 5G ไปทำไม ซึ่งถ้าให้นึกย้อนกลับไปอีกหน่อยของ 3G และ 4G ที่ผ่านมาเราก็ไม่เคยรู้เลยว่าแต่ละ G จะเปลี่ยนชีวิตเราไปขนาดไหน

ก่อน 3G จะใช้งานได้ครอบคลุมเมื่อสิบปีก่อน คนส่วนใหญ่ก็ยังนึกภาพออกแค่ว่า 3G ก็แค่โทรศัพท์แล้วเห็นหน้า และคนส่วนใหญ่ก็บอกว่าไม่ต้องการหรอก ใครจะอยากให้คนอื่นรู้ว่าตัวเองอยู่ที่ไหนตลอดเวลา หรือพอบอกว่าดูทีวีผ่านออนไลน์ได้ คนส่วนใหญ่ก็ยังไม่เข้าใจว่าการดูทีวีผ่านมือถือหน้าจอเล็กๆ มันจะไปสนุกอย่างไร

แต่พอ 3G เข้ามาสิ่งที่เกิดขึ้นคือการบูมของ Social media ที่ทำให้เราสามารถอัพโหลดรูปภาพ สเตตัส หรือเข้าถึง Google ได้ทุกที่ทุกเวลาจริงๆ และนั่นเองก็ก่อให้เกิดยุคของ Big Data เพราะเราเริ่มมี Data เยอะเกินกว่าความสามารถในการนำข้อมูลทั้งหมดมาใช้หรือวิเคราะห์ได้ทัน

แล้วพอ 4G เข้ามาสิ่งที่เปลี่ยนไปคือ Video Conetent บูมมาก เป็นยุคแจ้งเกิดของ Video Streaming ทั้งหลายไม่ว่าจะ Netflix หรือ YouTube เดิมทีเราต้องใช้เน็ตบ้านเพื่อดูวิดีโอออนไลน์ แต่พอวันนี้เราอยากดูตอนไหนก็ได้ทั้งนั้น และนั่นก็คือการเข้าสู่ยุค Personalized Content หรือเราทุกคนได้ดูในสิ่งที่เราอยากดูโดยไม่ต้องแคร์ใคร

หนังสือ A Little Book of BIG DATA and Machine Learning เล่มนี้ยังทำให้ผมเข้าใจแง่มุมของ Customer 360 กับการส่งผลต่อธุรกิจ Retail หรือการค้าขายมากขึ้น

เพราะเมื่อเรามี Data ลูกค้ามากพอเราสามารถเอา Customer Data มาประกอบกันไม่ว่าจะทั้งออฟไลน์ ออนไลน์ หรือเอาออนไลน์ทุกช่องทางมาประกอบกันเป็น Custoemr 360 เพื่อจะได้เข้าใจลูกค้าให้มากที่สุดในแบบที่ไม่เคยเป็นมาก่อน (เรื่องนี้ศึกษาเรื่อง CDP เพิ่มเติมได้ครับ) แล้วเมื่อการทำ Customer 360 เกิดขึ้นได้จริงก็ทำให้การทำ Omni-channel เกิดขึ้นได้จริงในแบบที่ควรจะเป็น

Omni-channel ไม่ใช่ Multi-channel

สร้างโอกาสการขาย ขยายรายได้ด้วย Omni-Channel - Digital Business Consult

ในฐานะนักการตลาดเราได้ยินคำว่า Omni-channel มานานมาก แต่ในความเป็นจริงที่เกิดขึ้นคือน้อยแบรนด์มากที่สามารถทำ Omni-channel ให้เกิดขึ้นได้จริง เพราะธุรกิจส่วนใหญ่ยังคงทำอยู่แค่ในระดับของ Multi-channel คือเพิ่มช่องทางในการติดต่อกับลูกค้าออกมามากมาย แต่ทุกช่องทางที่มีกลับไม่เคยเอา Customer data ลูกค้ามาเชื่อมต่อประกอบกันเพื่อเข้าใจลูกค้ามากขึ้นเลย

ตัวอย่างเช่น ถ้าคุณเคยทักแชทถามแบรนด์ผ่านทาง LINE หรือ Facebook Messenger เมื่อคุณเข้าไปที่ร้านค้าคุณก็ต้องป้อนข้อมูลให้พนักงานแบบเดิมว่าคุณต้องการอะไร หรือถ้าคุณใช้บริการผ่านแอปหนึ่ง แล้วพอคุณโทรหา Call-center พนักงานปลายสายก็จะถามคุณเหมือนเดิมว่า “มีอะไรให้ช่วยบ้างคะ?”

ทั้งๆ ที่แบรนด์มีข้อมูลเราอยู่แล้ว แต่ข้อมูลทั้งหมดดังกล่าวกลับถูกแยกส่วนไม่รวมกัน ทำให้แต่ละแผนกก็มีข้อมูลลูกค้าเป็นชิ้นๆ พอไม่เคยเอาข้อมูลลูกค้าทั้งหมดมาเชื่อมต่อกันก็ทำให้ลูกค้านี่แหละต้องคอยป้อนข้อมูลเดิมๆ ซ้ำๆ ให้แบรนด์อยู่เสมอ

ดังนั้น Big Data จะช่วยให้ธุรกิจรู้ว่าลูกค้าคนนี้เคยทำอะไรกับเรามาแล้วบ้าง พอเค้าติดต่อเข้ามาครั้งนี้เค้าน่าจะต้องการให้เราช่วยอะไร ฟังดูเหมือนเป็นเรื่องง่าย แต่เชื่อมั้ยครับว่าน้อยบริษัทในไทยที่จะทำ Customer 360 ให้เกิดขึ้นได้จริงๆ

Data-Driven Entertainment จาก case study ของ Netflix

How is Big Data Being

ในเล่มนี้มาการพูดถึง Netflix ที่เอา Data ไปใช้ต่อยอดธุรกิจมากมาย จนบอกได้เลยว่า Netflix ในวันนี้ไม่ใช่ธุรกิจวิดีโอออนไลน์ หรือ Entertainment แต่เป็นธุรกิจ Data ไปแล้วครับ

เพราะทุกครั้งที่เราเลือกดู ดูจนจบหรือไม่จบ ดูถึงจุดไหน ดูแล้วไปดูอะไรต่อ ดูแล้วให้คะแนนอย่างไร หรือเก็บเรื่องไหนไว้ใน My List บ้าง ทั้งหมดนี้ล้วนเป็น Data ที่ทำให้ Netflix เรียนรู้พฤติกรรมความชอบของลูกค้าจนสามารถเอามาเป็นแนวทางในการทำซีรีส์ยอดนิยมที่คนอเมริกันติดงอมแงมอย่าง House of Cards ได้

House of Cards คือซีรีส์เกี่ยวกับการเมืองที่โด่งดังมากในอเมริกา ซีรีส์เรืองนี้มาจากการวิเคราะห์ Data พฤติกรรมการดูของคนใน Netflix ว่าพวกเขาชอบโครงเรื่องแบบไหน ชอบนักแสดงชายแบบไหน นักแสดงหญิงอย่างไร ผู้กำกับคนไหนที่เขาชอบ จนออกมาเป็น House of Cards ซีรีส์ยอดนิยมที่ใช้ Data-Driven นั่นเองครับ

RFM Model ที่สำคัญในการทำ CRM ให้ไม่ใช่แค่ Loylty program

Source: http://www.libraryhub.in.th/2018/11/15/data-driven-in-library-work-part-1-rfm/

ก่อนอื่นต้องบอกเลยว่าจากที่ผมเจอมานักการตลาดและเจ้าของธุรกิจส่วนใหญ่ยังคงเข้าใจคำว่า CRM แบบผิดๆ จากเวลาที่ไปสอนเรื่อง Data for Marketing กับเหล่าผู้ประกอบการมาพบว่าพวกเขาเข้าใจว่า CRM คือการเก็บคะแนนและสะสมแต้มเท่านั้น

แต่ในความเป็นจริงแล้ว CRM คือ Customer Relationship Management หรือการทำอย่างไรให้ลูกค้าอยู่กับเรานานที่สุด ประทับใจเรามากที่สุด และก็อยากใช้เงินกับเรามากขึ้น

ดังนั้นการทำ CRM ที่ถูกต้องไม่ใช่แค่การสะสมแต้มแล้วให้อะไรกลับไปก็ได้ หรือให้โปรโมชั่นที่เหมือนๆ กัน แต่ต้องมีการเอา Customer Data มาวิเคราะห์ว่าลูกค้าแต่ละคนควรถูกจัดอยู่กลุ่มไหน แล้วเมื่อเราแบ่ง Segment ลูกค้าได้เราก็จะรู้ว่าเราจะต้องทำการตลาดแบบไหนกลับไปถึงจะทำให้ลูกค้าประทับใจเรายิ่งขึ้น ที่สำคัญส่งผลต่อยอดขายหรือกำไรบริษัทอีกด้วยครับ

เช่น ถ้าเป็นลูกค้าประจำสายช้อปหนักที่ใช้รหัส RFM555 คือทั้งมาประจำ มาถี่ และช้อปหนัก คนกลุ่มนี้อาจจะต้องหาของพิเศษหรือของดีๆ มาขายให้เค้าก่อน การลดอาจจะไม่จำเป็นเพราะอย่างไรก็ช้อปหนักอยู่แล้ว

แต่กลับกลุ่มที่นานๆ ซื้อที่แต่มาซื้อทีหมดหน้าตัก ลูกค้ากลุ่มนี้เราควรทำการตลาดให้เค้าแวะมาหาเราบ่อยขึ้น

จริงๆ แล้วการวิเคราะห์ข้อมูลโดยใช้ RFM Model ก็นับเป็นจุดเริ่มต้นในการทำ Personalization เหมือนกัน ในวันที่เทคโนโลยีพร้อมและก็มี Data มากมาย คุณต้องรีบหาทางเก็บข้อมูลมาวิเคราะห์แล้วทำ RFM Model ที่แม่นยำออกมาให้ไวที่สุดนะครับ

K-means เทคนิคการวิเคาะห์ข้อมูลของการแบ่ง Segmentation ของลูกค้า

K Mean. K mean is an unsupervised machine… | by Piyush Tyagi | Medium
Source: https://medium.com/@pytyagi/k-mean-522e2b741e4a

RFM Model ก็เป็นวิธีในการแบ่งลูกค้าออกมาเป็นกลุ่มๆ ตามพฤติกรรมการซื้อ แต่ถ้าจะทำ Customer Analyst ให้ลึกขึ้นก็ต้องมีการวิเคาะห์ตามลักษณะการซื้ออีกด้วย เช่น ซื้ออะไรคู่กับอะไรบ้าง ชอบมาซื้อวันหรือเวลาไหนเป็นพิเศษ โปรแบบไหนที่ชอบ หรืออื่นๆ

เมื่อธุรกิจที่ฉลาดในการเก็บ Data สามารถเก็บได้ถูกต้องและครอบคลุมในสิ่งที่ต้องนำไปใช้ ก็ควรรู้เทคนิคการจัดกลุ่มข้อมูลด้วย K-means

และสิ่งที่ผมชอบมากในหนังสือเล่มนี้คือ ดร.เอกสิทธิ์ แก้วาดภาพอธิบายเรื่อง K-means ไว้ให้นักการตลาดอย่างผมเข้าใจได้โดยง่าย แม้ก่อนหน้านี้จะพอรู้ว่า K-means คือการแบ่งกลุ่มที่ดูมีความใกล้เคียงกัน แต่พอเห็นภาพอธิบายทีละขั้นตอนจากหนังสือเล่มนี้ก็ทำให้เข้าใจยิ่งขึ้นไปอีกครับ

หรือพอได้โมเดลออกมาแล้วก็ต้องอย่าลืมเอาไปทดสอบความแม่นยำ

หนังสือเล่มนี้ก็บอกว่าเทคนิคการทดสอบ Model ที่ได้มีอย่างไรบ้าง ตั้งแต่การแบ่ง Data อีกชุดนึงไว้ไม่เอาไปใช้ในการสร้างโมเดล หรือการเอาข้อมูลทั้งหมดไปใช้ในการสร้างโมเดล แล้วแบ่งข้อมูลบางส่วนที่ใช้สร้างโมเดลออกมาทดสอบความแม่นยำไปเรื่อยๆ

สำหรับผมในฐานะนักการตลาดและที่ปรึกษาด้านนี้ ที่ไม่มีความสามารถด้าน Dev หรือ Coding ก็รู้สึกดีมากที่ได้อ่านหนังสือเล่มนี้ เพราะช่วยให้ผมเข้าใจแง่มุมต่างๆ ของการทำงานกับ Data มากขึ้น ทำให้เข้าใจว่าคนต้อง Dev หรือ Data Scientists เขามีเทคนิคอย่างไร หรือใช้ภาษาแบบไหน

เพราะสุดท้ายแล้วการทำงานกับ Data ก็ต้องใช้การสื่อสารกันอย่างมากระหว่างหลายๆ ฝ่าย มันก็เหมือนกับการส่งต่อ Data ระหว่างกัน ระหว่างนัก Domain expert กับ Data expert นั่นเองครับ

อ่านแล้วเล่า เล่มที่ 33 ของปี 2020

สรุปหนังสือ A Little Book of BIG DATA and Machine Learning ดร.เอกสิทธิ์ พัชรวงศ์ศักดา ที่จะทำให้คุณเข้าใจเทคนิคการทำ Data Science ได้ไม่ยาก

สรุปหนังสือ A Little Book of BIG DATA and Machine Learning
ทำไมข้อมูลระดับ Big Data จึงสำคัญ และทำไมการทำ Machine learning จึงเป็นอาวุธที่ทรงอานุภาพที่สุดในการแข่งขันทางธุรกิจในยุคปัจจุบัน
ดร.เอกสิทธิ์ พัชรวงศ์ศักดา เขียน
ภีรพล คชาเจริญ บรรณาธิการ
สำนักพิมพ์ INFOPRESS

20200831

อ่านสรุปหนังสือแนว Big Data ในอ่านแล้วเล่าต่อ > https://www.summaread.net/category/big-data/

สนใจสั่งซื้อออนไลน์ > http://bit.ly/AlittleBookofBigDataandMachineLearning