In partnership with
อัพเดทความเคลื่อนไหวโลก AI ประจำ 29 ก.ค. - 4 ส.ค. 2024
ไม่ได้เขียนอัพเดทข่าวนาน เพราะวันธรรมดางานเยอะมากกก ทำไม่ทันแล้ววว ก็เลยใช้วันหยุดมานั่งรีวิว อัพเดทต่างๆกัน
สัปดาห์ที่ผ่านมา โลก AI เรียกว่าอัพเดทกันแบบ ตามแทบไม่ทัน มันไวมากกก จะร้องไห้แล้ววว
อะ เริ่มต้น
- OpenAI อัพเกรดโมเดล GPT-4o ให้รองรับ Context ที่ยาวขึ้นถึง 64,000 tokens
- ตอนนี้เราก็สามารถโยนอะไรยาวๆ ไฟล์ใหญ่มากขึ้นให้มันได้ครับ จากเดิม ออกมาใหม่ๆ รับได้ 4,000 tokens ตอนนี้ขยายไปถึง 64,000 tokens หรือ 16 เท่า ...บ้าไปแล้ว
- Context ใหญ่ขึ้นขนาดนี้ ทำอะไรได้บ้าง ... พวกสรุปต่างๆ จากการยัดข้อมูลใหญ่ๆไป ก็จะทำได้ดีขึ้นมาก พวกสัมมนายาวๆทั้งวัน แล้วถอดเสียงเป็นสคริปต์ ส่งให้มันสรุปต่อก็จะง่ายขึ้นละ ไม่ต้องตัดเป็นหลายก้อน ...ไหนจะเรื่องการทำ Research ที่ต้องใช้ research paper มากมายเกินกว่ามนุษย์จะอ่านจบในเวลาสั้นๆ หรือการสร้างบทความที่มีคุณภาพขึ้น จากการยัดข้อมูลส่งไปให้มันเรียน ก็จะเขียนดีขึ้นด้วย
- OpenAI ต่อ กับ Advanced Voice Mode
- OpenAI เริ่มทะยอยเปิดฟีเจอร์ Advanced Voice Mode ที่อวดชาวโลกไปไม่กี่เดือนก่อน สามารถคุยโต้ตอบกับคนได้เป็นธรรมชาติมาก แต่เราได้แค่เห็นในคลิป ไม่ได้ใช้งานจริงซักที รอบนี้ เริ่มเปิดให้คนอื่นได้ใช้แล้ว เฉพาะผู้ใช้ ChatGPT Plus บางคน (เปิดแบบเบาๆ เรียกว่า Alpha 55)
- โหมดนี้ เค้าเรียกว่า Hyper Realistic Audio ที่สามารถหยุดรอจังหวะการสนทนาได้อย่างเป็นธรรมชาติด้วย...ไม่ธรรมดา...เราจะแยกลำบากแล้วว่ากำลังคุยกับคน หรือคุยกับ AI อยู่
- Google ปล่อยโมเดล Gemini 1.5 Pro
- มาที่ Google บ้าง หลังจากปล่อย Gemini 1.0 Pro เมื่อเดือน ก.พ. ทาง Google ก็เงียบหายไป แถมยังโดนประนามว่า ถามอะไรไปก็ไม่ค่อยตอบ ฉันเป็นโมเดลภาษา เรียกว่า เปิดมาฟอร์มใหญ่ แต่ลงสนามจริง โดนบุลลี่หนักเลย (จริงๆถ้าเล่นหลังบ้าน คือ Google AI Studio มันจะปิดการเซนเซอร์พวกนี้ได้นะ)
- มารอบนี้ Gemini 1.5 Pro (รุ่น Experimental 0801) กลับมาทวงบัลลังก์เบอร์ 1 ของการ Benchmark (ทดสอบโดย LMSYS ซึ่งจะอัพเดท Leaderboard ของ LLMs แต่ละค่ายเป็นประจำ) ...ความน่าเชื่อถือ ยังคงเป็นปริศนา บางคนก็ไม่ค่อยเชื่อการทดสอบจากค่ายนี้
- การทดสอบ ก็คงเป็นการทดสอบ เป็นการลองแบบเฉพาะเจาะจงกับงานบางอย่าง แต่พอใช้งานจริง ก็มีคนด่าอยู่ดี 555 ...ใครที่สมัครใช้ Gemini Advance ตอนนี้ เค้าอัพเกรดเป็นโมเดล Gemini 1.5 Pro เรียบร้อย
- Gemini 1.5 Pro เป็นโมเดลแบบ Multimodal ที่ฉลาดขึ้น รองรับทั้ง ตัวหนังสือ, รูปภาพ ไฟล์เสียง และวิดีโอ เช่นเดิม พร้อมกับขยาย Context Windows คือ ขนาดของข้อมูลที่โยนใส่เข้าไป เพิ่มเป็น 2,000,000 tokens ใหญ่กว่า Gemini 1.0 Pro ถึง 2 เท่า
- งานซับซ้อนต่างๆสำหรับธุรกิจ ก็จะทำได้เก่งขึ้นมากเช่นกัน เพราะมันประมวลผลข้อมูลได้ใหญ่มากขึ้น โดยเฉพาะงานด้านการวิเคราะห์ข้อมูลที่ซับซ้อน การพัฒนาซอฟท์แวร์
4. Google ปล่อยโมเดล Gemma 2 สำหรับรันบนอุปกรณ์
- ปล่อยโมเดลพี่ใหญ่อย่าง Gemini 1.5 Pro ไปแล้ว มาถึงโมเดลน้องเล็ก อย่าง Gemma 2 ที่รันบนอุปกรณ์ต่างๆได้ (เรียกว่า Gemma 2 2B คือ ฝึกด้วยชุดข้อมูล 2 พันล้านพารามิเตอร์ เทียบกับ GPT3.5 ที่ใช้ถึง 175 พันล้าน)
- เรียกว่าเป็นโมเดล ที่เพียงพอต่อการใช้งานทั่วไป ใช้ทรัพยากรน้อยลงหลายสิบเท่า แต่ความสามารถสูสีกัน จนเอามายัดใส่อุปกรณ์ต่างๆได้
- Gemma 2 เปิดแบบ 2 ตัว คือ แบบเล็กมากๆ (Gemma 2 2B) กับ แบบใหญ่ขึ้นมาอีกหน่อยแต่ยังเล็กอยู่ (Gemma 2 27B) ตัวหลัง Google คุยกว่าความสามารถสูสีกับ Llama 3 70B ของ Meta เลย (ในขนาดต่างกันเกินครึ่ง)
- มาที่ Meta บ้าง กับโมเดลใหม่ Segment Anything Model หรือ SAM 2
- อาทิตย์ก่อนหน้า พี่มาร์คเล่นใหญ่ ปล่อยตัว Llama 3.1 แบบ 70B และ 405B แบบสะเทือนวงการ
- มาอาทิตย์นี้ ก็ยังปังไม่ยอมหยุด กับโมเดลที่ฮือฮามาก คือ Segment Anything Model หรือ SAM 2 ที่มีความสามารถในการแยกแยะวัตถุต่างๆในรูปและวิดีโอได้
- สำหรับคนใช้ iPhone, iPad ให้นึกถึงตอนเราเปิดรูป เอานิ้วแตะตัวคน หรือจาน หรือวัตถุอะไรก็ตามในรูป แล้วลากมาวางในแอปอื่นๆได้ อารมณ์แบบนั้น
- แต่ SAM2 มันทำกับวิดีโอได้แล้ว เรียกว่าจะสร้างประโยชน์ให้กับวงการวิดีโออีกมากเลย เพราะมันเลือกวัตถุในวิดีโอหรือ Prompt สั่งแล้วเปลี่ยนได้แบบ Real Time ได้เลย ไม่ต้องรอ render วิดีโอใหม่
- ลองกันได้ที่นี่ครับ https://sam2.metademolab.com/demo
- Midjourney ออกเวอร์ชั่นใหม่ 6.1
- คุณภาพรูปที่มันสร้างมาได้ สวยกว่าเดิมมากกก โดยเฉพาะรูปคน เหมือนจนแยกไม่ออก พวกแขน ขา ตัว body คน skin texture ต่างๆ
- เจนได้เร็วกว่าเดิม 25%
- Runway ออกโมเดล Image-to-Video รุ่น 3
- เร็วกว่า ถูกกว่า โมเดลรุ่นก่อน
- มีออกมา 2 ตัว คือ Gen 3 Alpha กับ Gen 3 Alpha Turbo ที่เร็วกว่ารุ่นปกติ 7 เท่า
- สมรภูมิ Generative Video นี่เดือดสุดๆครับ เล่นเปิดตัวมาชนกัน ใกล้ๆกันเลย ทั้งของ Pika Labs, Dream Machine จากค่าย Luma AI, Kling ของจีน และ Sora จากค่าย OpenAI
- จากเดิมตอน Sora ออกมาใหม่ๆ คนว้าวกันมาก จน Lumier จาก Google ดับหายไปเลย
มาตอนนี้ ทุกคนก็พัฒนาตัวเองจนความสามารถใกล้ๆกันละ แถมราคาค่าบริการ ก็น่ารัก เป็นมิตรกับกระเป๋าเงิน (นึกว่าจะมาแบบเดือนละ $50) เจอ Kling ของจีน มาเดือนละ $5 เท่านั้นเอง เป็นราคาโปรที่ลดจากเดือนละ $12 (โปรหมดพรุ่งนี้) - https://klingai.com/
- Canva ซื้อกิจการ Leonardo.ai
- คนในวงการ Creator ก็ตื่นเต้นกันอยู่พอประมาณครับ เพราะ Leonardo.ai นี่เป็นเครื่องมือเจนภาพและวิดีโอที่ดัง ใช้งานไม่ยากมาก สร้างภาพและวิดีโอคุณภาพสูงแบบเสมือนจริงได้ มีคนใช้ราวๆ 19 ล้านคน (เยอะอยู่ 55)
- เป็นการซื้อเข้าไปเสริมความแข็งแรงให้ Product หลักได้เป็นอย่างดี ซึ่ง Canva ก็ซื้อธุรกิจที่เกี่ยวข้องมาอย่างต่อเนื่อง ปีนี้ก็เพิ่งซื้อ Affinity ที่ทำโปรแกรมคล้ายๆ Adobe Photoshop, Illustrator เข้ามาเสริม
- เราสมัครใช้ Canva กันถูกและใช้คุ้มค่ามากกกกก มันเก่งขึ้นเรื่อยๆ เราก็ยังจ่ายเท่าเดิม (ขอให้เป็นแบบนี้ไปนานๆ)
- โอลิมปิก ปารีส 2024 กับ AI
- คนอาจจะยังไม่ค่อยรู้นะครับว่าโอลิมปิกครั้งนี้ มีการนำ AI มาใช้งานค่อนข้างเยอะเลย
- ตั้งแต่การตัดต่อวิดีโอเพื่อทำ Highlight เป็นการตัดด้วย AI แบบอัตโนมัติ และยังปรับขนาดเป็นหลายฟอร์แมท เพื่อลงแพลตฟอร์มออนไลน์ต่างๆ โดยแพลตฟอร์มนี้เป็นของ Intel ชื่อว่า Intel Geti AI
- ยังใช้ AI ทำการพากย์และแปลเป็นภาษาอื่นๆด้วย เพื่อให้เข้าถึงคนทั้งโลกได้จริงๆ
- มีการใช้ AI เพื่อมอนิเตอร์แอคเคาท์บนโซเชียลมีเดีย นับแสนๆแอคเคาท์ เพื่อตรวจสอบข้อความ ความถูกต้อง หรือมีเรื่องข่าวปลอมมั้ย
- มีการทดสอบการใช้งาน AI Chatbot บนแพลตฟอร์ม Athlete365 (https://olympics.com/athlete365) ด้วย เพื่อช่วยตอบคำถามเกี่ยวกับกฏระเบียนต่างๆในการแข่งขัน กฏการตรวจสอบการใช้สารเสพย์ติด
- มีการนำเทคโนโลยี Digital Twin มาใช้ด้วย เพื่อทำ simulation การแข่งขันต่างๆ
- ระบบกล้องที่ใช้ในการแข่งขัน มีการพาร์ทเนอร์กับ Alibaba เพื่ออัดคลิปและรีเพลย์ รวมไปถึงการใช้ AI มาสร้างภาพ 3 มิติ จำลองการแข่งขันในกีฬาต่างๆ และประมวลผลมุมกล้องหลายตัวให้ดูได้ครบทุกมุม
- ขนาดนาฬิกา Omega ที่ใช้ในโอลิมปิกเพื่อจับเวลา ยังเพิ่มฟังก์ชั่น AI เข้าไปเลย โดยมีการใช้งานร่วมกับกล้อง เพื่อเก็บข้อมูล เช่น การวิ่งเข้าเส้นชัย การว่ายน้ำ กระโดดสูง ขี่จักรยาน แล้วนำมาเป็น data เพื่อวิเคราะห์ เปรียบเทียบ Performance
- เรียกได้ว่า โอลิมปิกครั้งนี้ เป็นครั้งแรกที่เป็นโอลิมปิกแบบ AI-powered มีการใช้งาน AI ในแทบทุกอณูของงาน โดยพาร์ทเนอร์หลักด้าน AI ในโอลิมปิกครั้งนี้ คือ Intel !! ....ที่ผลประกอบการแย่ หุ้นตกหนัก และเพิ่งให้พนักงาน 15,000 คน ออก
- สุดท้าย เป็นเรื่อง Responsible AI ระหว่างประเทศบราซิลกับ บริษัท Meta
- หน่วยงานที่ชื่อว่า National Data Protection Authority (ANPD) ของบราซิล ที่คอยดูแลเรื่องความปลอดภัยและข้อมูลความเป็นส่วนตัวของประเทศบราซิล ได้ทำการแบนบริษัท Meta ห้ามนำ AI มาใช้งานในบราซิล หลังจากสั่งให้บริษัท ห้ามนำข้อมูลส่วนตัวของประชากรบราซิลที่ใช้งาน Facebook และ Instagram ทั้งหมด กว่า 102 ล้านคน ไปเทรน AI
- แต่ Meta ก็ยังคงไม่ปฏิบัติตามกฏอย่างเคร่งครัด ไม่ยอมชี้แจงว่าเอาข้อมูลอะไรไปบ้างและไปทำอะไรบ้าง จนโดนแบน
- อยากให้บ้านเราเข้มกับแพลตฟอร์มเหล่านี้ให้มากขึ้น เพราะเราไม่รู้เลย ว่าเค้าเอาข้อมูลอะไรของเรา ไปเทรน AI เค้าบ้าง
สรุปงาน SCBX Unlocking AI EP 10: Responsible AI in Action: From Regulation to Real-World Impact
- The AI Regulatory Landscape: Navigating Current and Future Framework
โดย ดร.ศักดิ์ เสกขุนทด ที่ปรึกษาด้าน Digital Transformation จากสำนักงานพัฒนาธุรกรรมทางอิเล็กทรอนิกส์ (สพธอ.) - AI Success Story: Implementing Responsible AI Across Industries Around the Globe
โดย คุณกฤติยาณี บูรณตรีเวทย์ ทนายความและพาร์ทเนอร์จาก Baker McKenzie - How to Maximize AI Transformation in Corporate from Day 1 to Scale Out
โดย คุณณัฐพล จงจรูญเกียรติ Vice President จากบริษัท พีทีที โกลบอล เคมิคอล จำกัด (มหาชน) หรือ GC - Demarginalizing the Underserved with AI Lending
โดย คุณถิรนันท์ อรุณวัฒนกูล ประธานเจ้าหน้าที่ปฏิบัติการ บริษัท มันนิกซ์ (MONIX) จำกัด - Kickstarting All In Organizations: Creating Responsible AI Policies and Best Practices for Compliance
Newsletter ฉบับนี้ สปอนเซอร์โดย Intercom.com บริษัทซอฟท์แวร์ด้าน Customer Support ระดับโลก
เค้ากำลังแจกส่วนลด 90% ให้กับคนทำ Startup ทั่วโลก แนะนำให้รีบกดไปรับส่วนลด 90% เลยนะครับ เพราะระบบเค้า Software as a Service ใช้กันทั้งโลก ของเค้าดีจริง
Intercom for Startups
Join Intercom’s Early Stage Program to receive a 90% discount.
Get a direct line to your customers. Try the only complete AI-first customer service solution.