สรุปหนังสือ Big Data ดัดจริต

สรุปหนังสือ แบบสั้นๆเข้ากับสุภาษิตไทยว่า “ปากไม่ตรงกันใจ” เพราะคนเรามักถามอย่างตอบอย่าง ต่อให้เป็นการทำแบบสอบถามแบบปกปิดชื่อก็ยังไม่ค่อยอยากจะตอบความจริงกันเลย แต่สิ่งเดียวที่เรายอมบอกความจริงทุกอย่าง จนแม้แต่มันไม่ได้ถามเราก็อยากจะบอกเพื่อเอาคำตอบจากมัน นั่นก็คือ Google

ตั้งแต่ Google ถือกำเนิดขึ้น มนุษย์ทุกผู้คนก็ไม่เคยปิดบังความจริงอะไรจากกูเกิลเลย และทั้งหมดที่เราบอกกับกูเกิลหรือช่องเสริชของเว็บต่างๆ ก็ถูกรวบรวมเอามาตีแผ่พฤติกรรมอีกด้านของมนุษย์ที่เราคาดไม่ถึง แน่นอนว่าคาดไม่ถึงเพราะโดยเฉพาะในเรื่องรสนิยมทางเพศ ที่คราวนี้จะถูกเอามาแฉผ่าน Big Data

จะแค่ Data หรือ Big Data ก็ไม่สำคัญเท่ากับว่า Data นั้นบอกอะไรที่สำคัญหรือไม่ เพราะ Big Data จะมีค่าได้ก็ด้วย Data Science หรือการค้นหาความหมาย ความเชื่อมโยง หรือนัยยะที่ซ่อยอยู่ใน Data นั้น

ดังตัวอย่างในเล่มที่ผมจะเล่าให้ฟังต่อไปนี้ครับ

ด้วยเครื่องมือ Google Trend ง่ายๆที่ใครๆก็ใช้ได้ สามารถเอามาทำนายผลการเลือกตั้งได้แบบที่โพลสำนักไหนก็บอกไม่ได้ใกล้เคียงขนาดนี้

ตอนเลือกตั้งประธานาธิบดีเมื่อครั้งโอบามา ผู้เขียนพบว่าคะแนนของโอบามาในครั้งนั้นสัมพันธ์อย่างมีนัยยะสำคัญกับการข้อความค้นหาที่เกี่ยวกับ “การเหยียดสีผิว”

ผู้เขียนพบว่าในรัฐไหนที่มีการค้นหาการเหยียดสีผิวมาก คะแนนของโอบามาในรัฐนั้นก็จะได้น้อย ซึ่งพอเอาแผนที่ทั้งประเทศมากางเปรียบเทียบกับผลจากคะแนนเลือกตั้งดู ก็พบว่าใกล้เคียงกันจนน่าทึ่งเลยครับ

หรือกับพฤติกรรม “ลำดับของคำที่ใช้ในการค้นหา” ก็พอบอกได้ว่าผู้สมัครคนไหนจะได้คะแนนโหวตดีในพื้นที่นั้น

เพราะจาก Data บอกให้รู้ว่า ถ้าพื้นที่ไหนค้นหาคำว่า “เลือกตั้ง ฮิลลารี ทรัมป์” พื้นที่นั้นฮิลลาลีจะได้คะแนนสูงกว่า แต่ถ้าพื้นไหนค้นหาสลับกันว่า “เลือกตั้ง ทรัมป์ ฮิลลาลี” พื้นที่นั้นทรัมป์จะได้คะแนนนำมากกว่าครับ

ไม่น่าเชื่อก็ต้องเชื่อนะครับว่า แค่การลำดับชื่อผู้สมัครก่อนหลังแค่นั้น ก็บอกให้รู้ถึงความชอบลึกๆในใจคนได้โดยไม่รู้ตัว

เราเคยชื่อกันว่าเวลาเศร้าเรามักจะอยากดูหนังหรือรายการตลกๆ แต่ในความเป็นจริงไม่ใช่แบบนั้นเลย เพราะ Data บอกให้เรารู้ว่ายิ่งอารมณ์ดีอยู่แล้วต่างหากถึงอยากจะดูอะไรตลกๆ เหมือนอารมณ์ที่เราเป็นส่งเสริมให้เราต้องการเพิ่มครับ

ส่วนคำเสริชยอดนิยมของผู้ชายคืออะไรรู้มั้ยครับ ทายไม่ยาก นั่นก็คือเรื่องเกี่ยวกับ “เจ้าโลก” ของเค้านั่นแหละ ผู้ชายส่วนใหญ่เสริชหาว่าทำยังไงถึงจะอัพไซส์ได้ มีแค่ 1% เท่านั้นที่เสริชหาว่าทำยังไงให้เล็กลง

ส่วนผู้หญิงก็เหมือนกัน เสริชเกี่ยวกับอวัยวะเพศเป็นลำดับต้นๆ แต่สิ่งที่แตกต่างกันคือเค้าไม่ได้เสริชหาว่าทำอย่างไรให้ใหญ่หรือเล็ก แต่สิ่งที่ผู้หญิงกังวลมากที่สุดก็คือเรื่อง “กลิ่นของน้องสาว” ครับ ดังนั้นในตอนนี้ผมเข้าใจแล้วว่า ทำไมถึงต้องมีสินค้าที่ใช้เฉพาะจุดซ่อนเร้นของผู้หญิงแล้วครับ

และ Data ก็บอกให้รู้ว่าอากาศมีผลต่อการค้นหาคำที่เกี่ยวกับ “โรคซึมเศร้า” เพราะในพื้นที่ๆอากาศอบอุ่นนั้น จะมีอัตราการคนซึมเศร้าน้อยกว่าพื้นที่อากาศหนาวถึง 40% ตัวเลขนี้สำคัญมากเพราะลำพังยารักษาโรคซึมเศร้ายังทำได้แค่ 20% ดังนั้นถ้าอยากจะหายจากอาการซึมเศร้าหดหู่ ก็ให้ย้ายไปอยู่ในที่ๆอากาศดีแทนนะครับ

Big Data เกิดขึ้นมาเพื่อกำจัดอุปสรรคเดิมๆของมนุษยชาติ นั่นก็คือ “ความเชื่อ” แต่ความเชื่อในที่นี้ไม่ได้หมายถึงความเชื่อในด้านศาสนา แต่เป็นความเชื่อในทำนองที่ว่า “ชั้นเชื่อว่า” ที่มาจาก data อันน้อยนิดจากประสบการณ์เรานี่แหละครับ

เหมือนเราเชื่อว่าพายุทอร์นาโดนั้นอันตรายกว่าโรคหืดหอบ ทั้งที่ความเป็นจริงตาม data แล้ว โรคหืดหอบทำให้คนตายมากกว่าพายุทอร์นาโดเยอะเลยครับ

หรือเราเคยเชื่อกันว่านักกีฬาเก่งๆที่ประสบความสำเร็จส่วนใหญ่ต้องมาจากครอบครัวที่ยากจน หรือชีวิตต้องมีวิบากกรรม จนทำให้เค้าคนนั้นต้องทุ่มเทพยายามมากกว่าคนทั่วไป จนกลายมาเป็นนักกีฬาดังซูเปอร์สตาร์ได้

แต่ในความเป็นจริงจากการเก็บข้อมูลหรือ data เอามาวิเคราะห์อย่าละเอียดถี่ถ้วนพบว่า บรรดานักกีฬาดังที่ประสบความสำเร็จส่วนใหญ่เป็นคนธรรมดาที่มีฐานะค่อนข้างดีด้วยซ้ำ มีน้อยมากที่มาจากมรสุมชีวิตแบบละครน้ำเน่าอย่างที่เคยเชื่อ และเมื่อวิเคราะห์ต่อให้ลึกลงไปก็พบว่า การจะเป็นนักกีฬาที่ประสบความสำเร็จได้นั้นไม่ได้มาจากพรสวรรค์ แต่ต้องมาจากพฤติกรรม หรือนิสัยที่ทำให้ประสบความสำเร็จได้

นั่นก็คือการมีเวลาซ้อมมากพอที่จะพัฒนาความสามารถให้เก่งขึ้น อย่างไมเคิล จอร์แดน ที่โด่งดังในวงการบาสเก็ตบอลก็มาจากครอบครัวชนชั้นกลางที่มีฐานะ ที่พ่อแม่สามารถให้เวลาและทรัพยากรในระดับนึงที่เค้าจะทุ่มเทให้กับกาฝึกซ้อมจนกลายเป็นนักกีฬาซูเปอร์สตาร์ได้

และก็เข้าสู่พาร์ทที่น่าสนใจที่สุดในเล่ม นั่นก็คือ Insight in Data ที่บอกให้รู้ว่าคนส่วนใหญ่นั้นมีรสนิยมทางเพศแปลกประหลาดสุดโต่งกว่าโพลใดจะบอกได้แค่ไหน เพราะเมื่ออยู่หน้าจอแบบส่วนตัว เราก็บอกทุกสิ่งที่เราอยากรู้ให้ช่องเสริชรับรู้ด้วย

และ Data นี้ก็มีจากเว็บหนังโป๊ชื่อดังของโลก นั่นก็คือ Pornhub ที่พร้อมไขความลับเรื่องเพศให้คุณรู้ พร้อมหรือยังครับ ถ้าพร้อมแล้วเชิญอ่านต่อได้เลย

ผู้ชาย 16 จาก 100 คนที่เข้าเว็บ Pornhub จะค้นหาหนังโป๊ที่เป็นแนวคนในครอบครัวเดียวกัน โดยคำค้นหายอดฮิตคือ “พี่ชายกับน้องสาว” “แม่เลี้ยงจัดหนักกับลูกชาย” “แม่กับลูก” “แม่กับลูกชาย” และ “พี่ชายกับน้องสาวจริงๆ” นี่คือคำหลักๆที่ผู้ชายใช้ค้นหาใน Pornhub เป็นยังไงครับรสนิยมทางเพศที่ใครจะกล้าบอกคนอื่นหรือตอบแบบสอบถามว่าชอบดูอะไรทำนองนี้

และผู้หญิงเองก็ไม่น้อยหน้า เพราะวิดีโอยอดนิยม 100 อันดับแรกที่ถูกค้นหาโดยผู้หญิงจะมีอยู่ 9% ที่เป็นเรื่องของการเสพสมในครอบครัว พอลงรายละเอียดแล้วจะพบว่าไม่ต่างกับผู้ชายเท่าไหร่นัก โดยจะสลับบทบาทกันนิดหน่อย สลับจากแม่เป็นพ่อ และสลับจากลูกชายเป็นลูกสาวเท่านั้นเอง โดยคำค้นหายอดนิยมในหมู่ผุ้หญิงก็คือ “พ่อ และลูกสาว”

และคำที่ผู้ชายค้นหามากที่สุด 3 อันดับแรกของเว็บ Pornhub คือ “teen” “threesome” และ “blowjob” ส่วน 3 คำที่ผู้หญิงใช้ค้นหามากที่สุดคือ​ “passionate love making” “nipple sucking” และ “man eating pussy”

ส่วนที่แปลกประหลาดจาก Data ยังมีไม่น้อย แต่เก็บเอาไว้ให้คุณไปเปิดอ่านเองแล้วกันนะครับ มนุษย์เรานี่ก็มีจินตนาการเรื่องเพศไม่น้อยหน้ากันทั้งสองเพศจริงๆครับ

ส่วนที่เราเคยเชื่อกันว่าพอคนว่างงานก็น่าจะเข้าเว็บหางานกันมากขึ้นแน่ๆ อยากจะบอกว่าเรื่องนี้จริงแค่นิดหน่อย แต่จาก Data บอกว่าสิ่งที่คนเราเสริชหามากที่สุดในช่วงว่างงานหรือเศรษฐกิจตกต่ำไม่ใช่ “หางาน” หรอก แต่เป็น “เว็บโป๊” ต่างหาก

พออ่านถึงตรงนี้พอคิดออกมั้ยครับว่า “เว็บโป๊” กับการ “ว่างงาน” สัมพันธ์กันยังไง ติ๊กต่อกๆ หมดเวลา ผมขอเฉลยเลยว่าก็เพราะมัน “ว่างมาก” จนไม่รู้จะเอาเวลาไปทำอะไรยังไงล่ะครับ ส่วนอีกคำนึงที่ถูกค้นหาสูงมากในช่วงเศรษฐกิจว่างงานก็คือ “Spider Solitare” หรือก็เพราะว่างมากจนไม่รู้ต้องทำอะไร ก็ถ้าไม่ดูหนังโป๊ก็คงเล่นเกมฆ่าเวลาไปเรื่อยๆแหละครับ

ดังนั้นถ้าอยากจะใช้วิธี Re-Engineering หรือวิเคราะห์แบบย้อนหลังก็จะพบว่า เมื่อไหร่ที่คนเริ่มเสริชหาหนังโป๊ หรือเกมง่อยๆอย่างเรียงไพ่มากขึ้นผิดปกติ ก็สันนิฐานได้ว่าเศรษฐกิจน่าจะเริ่มตกสะเก็ด จนคนมีเวลาว่างมากขึ้นจนไม่รู้จะเอาไปทำอะไรนี่แหละครับ

และในช่วงเศรษฐกิจตกต่ำจนคนว่างงานสูง Data ก็ทำให้พบความจริงที่น่าเศร้าว่าพ่อแม่ชอบทำร้ายลูกในช่วงนั้นมากเป็นพิเศษ

แม้ข่าวจะรายงานว่ามีการแจ้งความทำร้ายร่างกายเด็กในครอบครัวต่ำลงมากเป็นประวัติการ แต่จาก Data ของพฤติกรรมการเสริชใน Google ไม่บอกแบบนั้น เพราะพบว่ามีการเสริชหาคำว่า “พ่อตีหนู” หรือ “แม่ทำร้ายฉัน” มากเป็นพิเศษ​ และพอดูจากรูปคำก็พอให้รู้ว่าคนที่ค้นหาคำนั้นคือเด็ก เด็กในบ้านที่ถูกตีพยายามหาคำตอบและหาทางออกด้วย Google

ดังนั้นไม่ต้องแปลกใจว่าทำไมการแจ้งความทำร้ายร่างกายจึงลดลงไม่เพิ่มขึ้น ก็เพราะผู้ใหญ่เลือกที่จะไม่แจ้งความนั่นเองครับ

Big Data ไปได้ดีในวงการแข่งม้าอย่างไม่น่าเชื่อ จากเดิมที่การเลือกม้าซักตัวจะมาจากประวัติของพ่อพันธุ์แม่พันธุ์มัน ว่าพ่อแม่มันนั้นเคยเป็นม้าแข่งที่ได้รางวัลหรือไม่ จากนั้นก็จะประมูลกันอย่างบ้าเลือด แต่มีชายคนนึงเข้ามาเปลี่ยนวิธีการเลือกม้าไปตลอดกาลด้วย Data หรือการใช้ Data Science เพื่อหาความสัมพันธุ์ของม้าที่ดีกับม้าที่ไม่ดีอย่างเป็นวิทยาศาสตร์และทำซ้ำได้ครับ

ชายคนนั้นชื่อว่าเซเดอร์ เค้าค้นพบความสัมพันธุ์ใน Data ของม้าแข่งที่ชนะบ่อยๆว่า ม้าที่ดีขึ้นอยู่กับขนาดของหัวใจและโพรงสมองด้านซ้าย และม้าม กับท่าก้าวขาของม้าบางท่าก็มีผลต่อความสำเร็จบนสนามแข่งของม้าแต่ละตัว

และเค้ายังค้นพบว่าหากม้าตัวไหนหอบหลังจากวิ่งไปเพียงแค่ 1/8 ไมล์ ก็ตัดม้าตัวนั้นทิ้งได้เลย เพราะม้าที่หอบบ่ออยแทบไม่เคยสร้างผลงาน

ดังนั้นการใช้เครื่องอัลตราซาวน์สแกนอวัยวะภายในของม้าเป็นสิ่งที่ไม่เคยเกิดขึ้นมาก่อนในวงการม้าแข่ง เพราะไม่เคยมีใครคิดวัด data ของแม้าแต่ละตัวอย่างจริงจัง ไม่เคยมีใครหาความสัมพันธุ์ของม้าแข่งแต่ละตัวที่ชนะ

ห้าง Walmart เองก็พบ data สำคัญสำหรับเพิ่มยอดขายว่าหลังพายุเฮอร์ริเคนผ่านไป คนส่วนใหญ่ต้องการอะไร แล้วก็สต็อกสินค้าที่คนต้องการล่วงหน้าไว้ที่สาขาใกล้เคียงแต่ไม่มีพายุเข้ามา พอพายุผ่านไปผู้คนเริ่มออกมาจับจ่ายใช้สอยก็รีบเอารถขนไปไว้ที่สาขานั่น และสิ่งที่ Data บอกว่าคนต้องการ “พายสตรอเบอร์รี่” มากจนยอดขายพุ่งขึ้นถึง 7 เท่า เมื่อเทียบกับช่วงปกติครับ

Netflix เองก็เรียนรู้ว่า “อย่าเชื่อในสิ่งที่คนบอก แต่ให้ดูจากสิ่งที่คนทำ”

เค้าค้นพบว่าในรายการหนังที่อยากดูของคนส่วนใหญ่ มักจะเลือกหนังดีๆหรือไม่ก็สารคดีเพิ่มความรู้เข้ามาเรื่อยๆ แต่ในความเป็นจริงคนส่วนใหญ่ก็ยังเลือกดูอะไรที่บันเทิงหรือไร้สาระต่อไป ไม่ได้สนใจจะเข้ามาดูอะไรที่ตัวเองเก็บไว้ใน playlist เลย

ดังนั้น Netflix จึงใช้ data พวกนี้ในการเลือกหนังที่ตรงใจเรามากขึ้น จนทำให้เราต้องดูมันทั้งวันจนแทบไม่อยากลุกไปไหนเลยนี่แหละครับ

ยังมีอีกหลายช่วงในเล่มที่อยากจะเล่าให้ฟัง แต่ผมคิดว่าเอาแค่หอมปากหอมคอประมานนี้ก่อนแล้วกันครับ เพราะหนังสือเล่มนี้ไม่ได้เต็มไปด้วยศัพท์วิชาการที่จะมีแต่นัก Data Science เท่านั้นที่จะเข้าใจได้

ผมค่อนข้างแน่ใจว่าถ้าคุณเล่นเฟซบุ๊กเป็น โพสรูปได้ จะไปเที่ยวไหนก็เปิดกูเกิลแมพเป็นประจำ คุณก็จะสามารถสนุกกับหนังสือเล่มนี้ได้ไม่ยาก “ดัดจริต Big Data” (ผมขอเรียกสลับลำดับกันเพราะคิดว่าแบบนี้จะเข้ามากกว่าครับ) จะเป็นหนังสือที่คุณอ่านแล้วไม่อยากให้จบโดยไม่รู้ตัว

เพราะ Data ยังมีอะไรอีกมากให้คุณรู้ และคุณจะได้รู้ในความลับของมนุษยชาติที่ไม่เคยมีใครบอก เพราะทุกคนในวันนี้เต็มใจที่จะบอก Google อย่างไม่อายครับ

สรุปหนังสือ Big Data ดัดจริต

อ่านแล้วเล่า เล่มที่ 36 ของปี 2019

สรุปหนังสือ Big Data ดัดจริต
เรียบเรียงจาก Everybody Lies
SETH STEPHENS-DAVIDOWITZ เขียน
เรียบเรียงโดย ธนกร นำรับพร
สำนักพิมพ์ ซีเอ็ด

อ่านครั้งที่หนึ่งเมื่อ 2019 06 13

สนใจสั่งซื้อได้ที่ https://m.se-ed.com/Detail/BIG-DATA-%E0%B8%94%E0%B8%B1%E0%B8%94%E0%B8%88%E0%B8%A3%E0%B8%B4%E0%B8%95-(Everybody-Lies)/9786160833658

อ่านสรุปหนังสือแนว Big Data เพิ่มเติมได้ที่ https://www.summaread.net/business/data-for-the-people/

By Nattapon Muangtum

จากนักอ่านที่เริ่มอยากหัดเขียน จากการที่ต้องอ่านเพราะความจำเป็น กลายเป็นอ่านเพราะหลงไหล, สวัสดีครับผมชื่อหนุ่ย ผมทำงานด้าน Digital and Data Marketing ผมยังมีเพจการตลาดอีกเพจที่อยากฝากให้ลองอ่านดูนะครับ https://www.facebook.com/everydaymarketing.co/