ยุคของ Gemini

เมื่อปีที่แล้ว ในงาน Google I/O ได้เปิดตัว Gemini (Gemini) โมเดลปัญญาประดิษฐ์ AI รุ่นใหม่ที่ออกแบบมาให้รองรับการประมวลผลข้อมูลหลายรูปแบบตั้งแต่แรก ไม่ว่าจะเป็นข้อความ รูปภาพ วิดีโอ โค้ด เปรียบเหมือนเป็น "อินพุต-เอาต์พุต (I/O)" สำหรับยุคใหม่ โดยแสดงประสิทธิภาพที่ดีเยี่ยมในทุกมาตรฐานด้วยระบบมัลติโมดอล (Multimodal) ถัดมาอีกสองเดือน Google ได้เปิดตัว Gemini 1.5 Pro (Gemini 1.5 โปร) ซึ่งเป็นการพัฒนาครั้งสำคัญในด้านการประมวลผลข้อมูลบริบทขนาดใหญ่สามารถประมวลผลข้อมูลได้มากถึง 1 ล้านโทเค็น (token) อย่างต่อเนื่อง
นอกจากนี้ยังได้นำความสามารถอันล้ำหน้าของ Gemini ไปประยุกต์ใช้ในผลิตภัณฑ์ต่างๆ ของ Google อย่างมีประสิทธิภาพ โดยมีการแสดงตัวอย่างในวันที่ 14 พฤษภาคม 2567 ซึ่งครอบคลุมทั้งระบบค้นหา, รูปภาพ, Workspace, Android และอื่นๆ อีกมากมาย

ความคืบหน้าของผลิตภัณฑ์

ปัจจุบัน Google ที่มีผู้ใช้งานกว่า 2 พันล้านคน ล้วนใช้เทคโนโลยี Gemini อยู่เบื้องหลังได้เปิดตัวประสบการณ์การใช้งานใหม่ๆ ผู้ใช้สามารถโต้ตอบกับ Gemini ได้โดยตรงผ่านแอปพลิเคชันรองรับทั้งระบบ Android และ iOS และยังมีบริการเสริมอย่าง Gemini Advanced ซึ่งมอบสิทธิ์การเข้าถึงโมเดลที่มีความสามารถสูงสุด ภายในระยะเวลาเพียง 3 เดือน มีผู้ใช้งานกว่า 1 ล้านคน ลงทะเบียนเพื่อทดลองใช้บริการและยังคงมีแนวโน้มการเติบโตอย่างต่อเนื่อง

การค้นหาที่ชาญฉลาดยิ่งขึ้นด้วยGemini

การค้นหาของ Google มีการพัฒนาที่น่าตื่นเต้นด้วยเทคโนโลยี Gemini Google Search Generative Experience ในช่วงปีที่ผ่านมา ซึ่งได้ตอบคำถามไปแล้วหลายคำถาม เนื่องจากมีผู้คนใช้การค้นหาในรูปแบบใหม่ ๆ ตั้งคำถามที่ซับซ้อนและยาวขึ้น รวมถึงการค้นหาด้วยรูปภาพ และได้รับผลลัพธ์ที่ดีที่สุดจากเว็บไซต์ต่างๆ โดย Google ยินดีที่จะประกาศเปิดตัวฟีเจอร์ AI Overviews ที่ได้ปรับปรุงการค้นหาให้กับผู้ใช้ทุกคนในสหรัฐอเมริกาและจะทยอยเปิดตัวในประเทศอื่น ๆ เร็วๆนี้

ค้นหาภาพถ่ายแสนง่ายด้วย Ask Photos

Google Photos แอปจัดเก็บรูปภาพที่เปิดตัวมาเกือบเก้าปีแล้วผู้คนใช้มันจัดระเบียบความทรงจำสำคัญ โดยมีรูปภาพและวิดีโอมากกว่า 6 พันล้านรายการที่ถูกอัปโหลดทุกวัน! โดยฟีเจอร์ Ask Photos ใหม่จะช่วยให้การค้นหาภาพถ่ายง่ายยิ่งขึ้นตัวอย่างเช่น ผู้ใช้จำหมายเลขทะเบียนรถตัวเองไม่ได้แต่ก่อน ผู้ใช้อาจจะต้องค้นหาด้วยคีย์เวิร์ด แล้วเลื่อนดูรูปภาพ แต่ตอนนี้เพียงแค่ถามระบบจะจดจำรถที่ปรากฏบ่อยๆ และประมวลผลข้อมูลและบอกหมายเลขทะเบียนของผู้ใช้และช่วยค้นหาความทรงจำได้ลึกซึ้งยิ่งขึ้น Gemini จะวิเคราะห์ข้อมูลมากกว่าการค้นหาแบบง่ายๆ โดยแยกบริบทที่ต่างกันออกไปหรือข้อความ โดย Ask Photos จะสรุปข้อมูลทั้งหมดไว้ด้วยกันช่วยให้ผู้ใช้ย้อนรำลึกความทรงจำอันแสนวิเศษได้อีกครั้ง ซึ่งทาง google จะเปิดตัว Ask Photos ในช่วงฤดูร้อนนี้พร้อมฟีเจอร์เพิ่มเติมที่กำลังจะตามมา

Google I/O 2024 มุ่งสู่ พัฒนาอนาคตของเทคโนโลยีที่ยั่งยืน

ปลดล็อคความรู้ด้วยระบบมัลติโมดอลและบริบทขนาดใหญ่

การปลดล็อกความรู้ในรูปแบบต่างๆ คือเหตุผลที่ทาง Google สร้าง Gemini ให้มีหลากหลายรูปแบบตั้งแต่เริ่มต้น เป็นโมเดลเดียวที่มีความสามารถทั้งหมดในตัว ค้นหาความเชื่อมโยงระหว่างสิ่งเหล่านั้นด้วยระบบมัลติโมดอล ช่วยขยายขอบเขตของคำถามที่เราสามารถถามและขยายขอบเขตของคำตอบที่เราจะได้รับ บริบทขนาดใหญ่ (long context) ยกระดับการทำงานไปอีกขั้น โดยสามารถดึงข้อมูลเพิ่มเติมเข้ามาประมวลผลได้มากขึ้นไม่ว่าจะเป็น บทความหลายร้อยหน้า บันทึกเสียงหลายชั่วโมง วิดีโอความยาวหนึ่งชั่วโมงคลังโค้ดทั้งหมด เราได้ทำการปรับปรุงผู้ใช้ภาพหลายครั้งทั้งในด้านการแปล การเขียนโค้ด และการใช้เหตุผล ผู้ใช้จะเห็นการอัปเดตเหล่านี้แสดงในโมเดลตั้งแต่วันที่ 17 พฤษภาคม 2567เป็นต้นไป

นอกจากนี้ google กำลังนำ Gemini 1.5 Pro เวอร์ชันปรับปรุงนี้มาสู่นักพัฒนาทั่วโลก ในปัจจุบัน Gemini 1.5 Pro พร้อม 1 ล้านบริบท พร้อมให้บริการโดยตรงสำหรับผู้ใช้ใน Gemini Advanced แล้ว สามารถใช้งานได้ถึง 35 ภาษา

Gemini ก้าวขยายบริบท 2 ล้านโทเค็น

Google กำลังขยายหน้าต่างบริบทเป็น 2 ล้านโทเค็น และเปิดให้นักพัฒนาใช้งานได้ในการดูตัวอย่างแบบส่วนตัว เป็นเรื่องที่น่าทึ่งมากที่ได้มองย้อนกลับไปดูว่ามีความก้าวหน้าไปมากเพียงใดในช่วงไม่กี่เดือน

พลังของGeminiใน Google Workspace

พูดถึงความก้าวหน้าทางเทคนิค 2 ด้าน ระบบมัลติโมดอลและบริบทขนาดใหญ่ เมื่อใช้ร่วมกัน ยกระดับความสามารถและความชาญฉลาด ตัวอย่างการทำงานร่วมกับ Google Workspace เช่น การใช้ Gemini วิเคราะห์ได้ทั้งเนื้อหาอีเมลและไฟล์แนบ (เช่น PDF)

ปฏิวัติการเรียนรู้ด้วยเสียง

Audio Overviews ใน NotebookLM ฟีเจอร์นี้เป็นตัวอย่างที่ชัดเจนของความก้าวหน้า โดยใช้ Gemini 1.5 Pro วิเคราะห์ข้อมูลต้นฉบับของผู้ใช้ และสร้างบทสนทนาแบบเสียงที่ปรับแต่งตามบุคคลและสามารถโต้ตอบได้

โอกาสของโมเดล AI แบบมัลติโมดอล ผสมผสานรูปแบบข้อมูล (Input/Output) : ในอนาคต ผู้ใช้จะสามารถผสมผสานรูปแบบข้อมูลทั้งขาเข้า (Input) และขาออก (Output) ได้อย่างอิสระ ตัวอย่างเช่น ป้อนข้อมูลเป็นข้อความ แล้วรับผลลัพธ์เป็นเสียง หรือป้อนข้อมูลเป็นเสียง แล้วรับผลลัพธ์เป็นภาพ

ตัวแทน AI อัจฉริยะ

ตัวแทน AI (AI Agents) คือระบบปัญญาประดิษฐ์ที่แสดงเหตุผล การวางแผน และความทรงจำ พวกเขาสามารถ "คิด" ล่วงหน้าได้หลายขั้นตอน และทำงานข้ามซอฟต์แวร์และระบบ เพื่อบรรลุเป้าหมายโดยอยู่ภายใต้การควบคุมของเรา เพื่อให้เราควบคุมได้ตลอดเวลาส่วนนั้นสำคัญมาก ในขณะที่ google สร้างต้นแบบประสบการณ์กำลังคิดอย่างหนักว่าจะทำอย่างไรให้เป็นส่วนตัว ปลอดภัย และใช้ได้กับทุกคน

พลังของ Gemini: ก้าวสู่เป้าหมายปัญญาประดิษฐ์เพื่อทุกคน

Gemini โมเดลปัญญาประดิษฐ์อันทรงพลัง ที่รองรับการประมวลผลข้อมูลหลายรูปแบบ (multimodality) บริบทขนาดใหญ่ (long context) และ ตัวแทน AI นั่นคือ การสร้างปัญญาประดิษฐ์ที่เป็นประโยชน์สำหรับทุกคน สามารถจัดระเบียบข้อมูลทั่วโลก ทำให้ข้อมูลเข้าถึงได้ง่าย ผ่านทางผลลัพธ์ที่หลากหลาย เชื่อมโยงข้อมูลของโลกเข้ากับข้อมูลของเรา

เบิกทางสู่โลกปัญญาประดิษฐ์

ทางทีมงาน Google DeepMind มุ่งมั่นพัฒนาเทคโนโลยีปัญญาประดิษฐ์อย่างต่อเนื่อง Gemini 1.5 โปร: ได้รับความสนใจอย่างมากในเรื่องของการประมวลผลข้อมูล แต่เสียงตอบรับจากนักพัฒนา ยังต้องการโมเดลที่เร็วและคุ้มค่ากว่า ดังนั้น google ได้เปิดตัว Gemini 1.5 Flash โมเดลน้ำหนักเบาที่ออกแบบมาเพื่อใช้งานขนาดใหญ่ เหมาะสำหรับงานที่ต้องการความเร็วในการประมวลผลและคุ้มค่า โดย Gemini 1.5 แฟลช จะพร้อมใช้งานใน AI Studio และ Vertex AI

ในอนาคตข้างหน้า Google มุ่งมั่นพัฒนาเทคโนโลยีปัญญาประดิษฐ์ (AI) อย่างต่อเนื่อง เป้าหมายสำคัญคือ การสร้างตัวแทนอัจฉริยะ (Universal Agent) ที่จะสามารถช่วยเหลือผู้คนในชีวิตประจำวันได้อย่างมีประสิทธิภาพ

โครงสร้างพื้นฐานสำหรับยุค AI: ขอแนะนำ Trillium

Google กำลังพัฒนาโครงสร้างพื้นฐานสำหรับยุคปัญญาประดิษฐ์ (AI) โดยเปิดตัว Trillium ซึ่งเป็น TPU รุ่นที่ 6 ของบริษัทที่มีประสิทธิภาพและประหยัดพลังงานที่สุดเท่าที่เคยมีมา Trillium จะวางจำหน่ายให้กับลูกค้า Cloud ในปลายปี 2024 นอกจากนี้ยังได้ประกาศความร่วมมือกับ NVIDIA เพื่อนำเสนอ GPU รุ่นใหม่ล่าสุดของ Blackwell ให้กับลูกค้าในช่วงต้นปี 2025 ซึ่งนอกจากฮาร์ดแวร์แล้ว Google ยังมีการพัฒนาซอฟต์แวร์และระบบนิเวศแบบครบวงจรเพื่อรองรับ AI ซึ่งรวมถึงการค้นหาด้วยเสียง การค้นหาด้วยรูปภาพ และฟีเจอร์ใหม่ล่าสุดอย่าง Circle Search ผู้ช่วยอัจฉริยะรุ่นใหม่ของ Google คือ Gemini ซึ่งสามารถโต้ตอบด้วยเสียงได้อย่างเป็นธรรมชาติ นอกจากนี้ยังมีการเปิดตัวรุ่น Gemini Nano ที่รองรับการทำงานบนอุปกรณ์เคลื่อนที่ด้วย โดยในงานนี้ Google ยังเน้นย้ำถึงแนวทางการพัฒนา AI อย่างรับผิดชอบ โดยได้พัฒนาวิธีการตรวจจับเนื้อหาที่สร้างโดย AI ด้วยลายน้ำ

สิ่งใหม่ใหม่ล่าสุดของการค้นหา

Google Search เป็น AI กำลังก้าวเข้าสู่บทบาทที่น่าตื่นเต้นที่สุด ได้มีการลงทุนและพัฒนาอย่างต่อเนื่องใน Google Search ตั้งแต่เริ่มก่อตั้ง โดยมุ่งหวังช่วยผู้คนค้นหาข้อมูลมหาศาลบนโลกออนไลน์ได้ง่ายขึ้นตลอดการเปลี่ยนแปลงของแพลตฟอร์ม โดย Google Search เป็น AI พัฒนาขึ้นเรื่อยๆ เพื่อตอบสนองคำถามได้ดียิ่งขึ้น ไม่ว่าจะเป็นการค้นหาบนมือถือที่อาศัยบริบท สถานที่ และข้อมูลเรียลไทม์ หรือการค้นหาด้วยเสียง ฮัมเพลง หรือรูปภาพ ในยุคของ Gemini การค้นหาจะก้าวไปอีกขั้น ด้วยการผสมผสานโครงสร้างพื้นฐานอันแข็งแกร่ง ความสามารถของปัญญาประดิษฐ์ (AI) ขั้นสูง มาตรฐานผู้ใช้ภาพข้อมูลที่เข้มงวด และประสบการณ์ยาวนานในการเชื่อมต่อผู้คนกับข้อมูลมหาศาลบนเว็บไซต์ ผลลัพธ์ที่ได้คือ เครื่องมือค้นหาที่ทำงานแทนผู้คน Google Search เป็น AI คือ ตัวอย่างของปัญญาประดิษฐ์เชิงสร้างสรรค์ ที่ตอบสนองความอยากรู้อยากเห็นอันไร้ขอบเขตของมนุษย์ นี่คือสิ่งที่น่าตื่นเต้นที่สุดของ Google Search AI

Google Search ในรูปแบบ Ai

ตั้งแต่เริ่มต้น Google มุ่งมั่นพัฒนาเครื่องมือค้นหาอย่างต่อเนื่อง เพื่อช่วยผู้คนจัดการกับข้อมูลมหาศาลบนโลกออนไลน์ตลอดการเปลี่ยนแปลงของเทคโนโลยี Google Search พัฒนาควบคู่ไปด้วย ไม่ว่าจะเป็นการค้นหาบนมือถือที่ชาญฉลาดขึ้นด้วยการใช้บริบท สถานที่ และข้อมูลเรียลไทม์ หรือการค้นหาด้วยเสียง ฮัมเพลง หรือรูปภาพ ในยุคของ Gemini ค้นหาจะก้าวไปอีกขั้น! โดยผสานความแข็งแกร่งของโครงสร้างพื้นฐาน เทคโนโลยีปัญญาประดิษฐ์ (AI) ล้ำสมัย มาตรฐานผู้ใช้ภาพข้อมูลที่เข้มงวด

Gemini: ผู้ช่วยอัจฉริยะที่มากกว่าแชทบอท
Gemini คือผู้ช่วยอัจฉริยะส่วนตัวที่ออกแบบมาเพื่อช่วยเหลือคุณในการจัดการงานที่ซับซ้อนและดำเนินการต่างๆ แทนคุณ การโต้ตอบกับ Gemini จะเป็นไปอย่างราบรื่นและสื่อสารกันได้อย่างเป็นธรรมชาติ

Gemini for Android

ผู้ช่วยอัจฉริยะประจำเครื่อง Gemini พร้อมเป็นผู้ช่วยคนใหม่บนมือถือระบบแอนดรอยด์ของผู้ใช้ คอยช่วยเหลือผู้ใช้ได้ทุกที่ ทุกเวลา ปลอดภัยขั้นสุด แม้จะมีฟีเจอร์ใหม่ อย่าง Gemini Nano ที่ทำงานได้หลากหลาย ทั้งข้อความ รูปภาพ เสียง และคำพูด แต่ข้อมูลของผู้ใช้ยังคงปลอดภัย

การพัฒนาปัญญาประดิษฐ์ (AI) อย่างต่อเนื่อง

Google ยังคงมุ่งมั่นพัฒนา AI อย่างต่อเนื่อง โดยทางGoogle กำลังพัฒนาเทคนิคล้ำสมัยที่เรียกว่า Red teaming ที่ได้รับความช่วยเหลือจาก AI ซึ่งดึงเอาความก้าวหน้าในการเล่นเกมของ Google DeepMind เช่น AlphaGo นอกจากนี้ Google ยังได้ขยายนวัตกรรมเครื่องมือการใส่ลายน้ำที่เรียกว่า SynthID ในข้อความและวิดีโอรูปแบบใหม่สองรูปแบบ เพื่อให้ระบุเนื้อหาที่สร้างโดย AI ได้ง่ายขึ้น

สร้างอนาคตร่วมกัน
Google มุ่งมั่นพัฒนาเทคโนโลยี AI อย่างต่อเนื่อง โดยอาศัยความแข็งแกร่งของทีมวิจัย โครงสร้างพื้นฐานที่ทันสมัย และผลิตภัณฑ์ที่เป็นประโยชน์ Google มุ่งหวังที่จะนำ AI ไปใช้เพื่อประโยชน์ต่อสังคม และสร้างอนาคตที่ดีกว่า

ปัจจัยที่ขับเคลื่อนความก้าวหน้าของ AI ใน Google:

ทีมวิจัยชั้นนำ: Google มีทีมวิจัยด้าน AI ที่มีความสามารถสูง

โครงสร้างพื้นฐานที่แข็งแกร่ง: Google มีโครงสร้างพื้นฐานที่รองรับการพัฒนาและใช้งาน AI อย่างมีประสิทธิภาพ

ผลิตภัณฑ์ที่ขับเคลื่อนด้วย AI: Google พัฒนาผลิตภัณฑ์ที่ใช้ประโยชน์จาก AI ตัวอย่างที่สำคัญคือ Google Search ที่ใช้พลังจาก Gemini

ความสำเร็จของ Google ในด้าน AI:

การบุกเบิกความก้าวหน้า: Google เป็นผู้นำในการวิจัย AI ผลงานวิจัยของ Google เป็นรากฐานสำคัญของเทคโนโลยี AI ที่ทันสมัย

การผลักดันความก้าวหน้า: Google มีบทบาทสำคัญในการผลักดันความก้าวหน้าด้าน AI ทั้งสำหรับบริษัทเองและสำหรับอุตสาหกรรม

โครงสร้างพื้นฐานชั้นนำ: Google มีโครงสร้างพื้นฐานที่ทันสมัย รองรับการพัฒนาและใช้งาน AI อย่างมีประสิทธิภาพ

นวัตกรรมล้ำสมัย: Google พัฒนาเทคโนโลยี AI ที่ล้ำสมัย ตัวอย่างที่สำคัญคือ Gemini

ผลิตภัณฑ์ที่ช่วยเหลือผู้คน: Google พัฒนาผลิตภัณฑ์ที่ใช้ AI ช่วยเหลือผู้คนในหลากหลายรูปแบบ

แพลตฟอร์มสำหรับอนาคต: Google พัฒนาแพลตฟอร์ม AI ช่วยให้ทุกคนสามารถสร้างสรรค์อนาคตได้