Gemini (מודל שפה)

מתוך המכלול, האנציקלופדיה היהודית
קפיצה לניווט קפיצה לחיפוש
יש להשלים ערך זה: בערך זה חסר תוכן מהותי.
הנכם מוזמנים להשלים את החלקים החסרים ולהסיר הודעה זו. שקלו ליצור כותרות לפרקים הדורשים השלמה, ולהעביר את התבנית אליהם.
יש להשלים ערך זה: בערך זה חסר תוכן מהותי.
הנכם מוזמנים להשלים את החלקים החסרים ולהסיר הודעה זו. שקלו ליצור כותרות לפרקים הדורשים השלמה, ולהעביר את התבנית אליהם.
Gemini
מחזור חיים 6 בדצמבר 2023 – הווה (שנה)
סוג רישיון רישיון תוכנה לא חופשי
קטגוריה מודל שפה גדול

Gemini הוא מודל שפה גדול רב-מודאלי (אנ') המפותח על ידי חברת Google DeepMind. משמש כיורש למודלי השפה LaMDA ו-PaLM. המודל הוכרז ב-6 בדצמבר 2023 ומתחרה במודל השפה GPT-4 של חברת OpenAI.

החל מינואר 2024 נגיש מודל השפה דרך אפליקציית ג'מיני (לשעבר בארד).

היסטוריה

פיתוח

גוגל הכריזה על Gemini, מודל שפה גדול המפותח על-ידי חברת הבת שלה Google DeepMind, במהלך כנס Google I/O שנערך ב-10 במאי 2023. Gemini סומן כיורש עוצמתי יותר למודל השפה PaLM 2, אשר הוכרז גם הוא במהלך אותו כנס, וסונדאר פיצ'אי, מנכ"ל חברת גוגל, הודיע כי Gemini נמצא בשלבי פיתוח מוקדמים.[1][2] Gemini פותח בשיתוף פעולה בין DeepMind ל-Google Brain (אנ'), שתי חברות בת של גוגל שמוזגו בהמשך לחברת Google DeepMind.[3]

השקה

ב-6 בדצמבר 2023 הכריזו סונדאר פיצ'אי, מנכ"ל חברת גוגל, ודמיס הסביס, מנכ"ל חברת DeepMind, על השקת מודל השפה Gemini.[4]

תכונות ומאפיינים

ג'מיני זמין למשתמשים (נכון לאפריל 2025), הן כאתר אינטרנט שאליו ניתן לגשת באמצעות דפדפן, והן כיישום (אפליקציה) לטלפונים ניידים. מכיוון ש"גוגל" היא הבעלים של דפדפן "כרום" כמו גם של מערכת ההפעלה "אנדרואיד" - החברה "דוחפת" את היישום כיישום ברירת מחדל בכל מקום שבו היא יכולה וזה מותר לה. מערכת ההפעלה "אנדרואיד" היא מערכת ההפעלה הנפוצה בעולם.

נכון לאפריל 2025, ג'מיני בגרסה 2.5 הוא מודל השפה החזק ביותר בשוק, לפי (https://lmarena.ai/?leaderboard). המודל משולב עם ג'ימייל, יו-טיוב, גוגל חיפוש, גוגל מאפס, גוגל דרייב, גוגל יומן, גוגל תמונות (באופן חלקי), גוגל מסמכים, גוגל מצגות. ניתן גם לגשת ישירות מתוך המודל למחולל הווידאו מטקסט של גוגל - Veo2 שנחשב למודל הכי חזק בשוק (נכון לאפריל 2025). המודל זמין גם מתוך "גוגל סטודיו" ומתוך "גוגל וורטקס".

ג'מיני הוא גם המודל התומך בביצוע "מחקרי עומק" - Deep Research - תכונה שמאפשרת מחקר "ספרות" מעמיק באינטרנט באמצעות "רשת של סוכני בינה מלאכותית" על ידי כתיבת "תוכנית פעולה למחקר", ביצוע מחקר באינטרנט, "הצלבות" בין המוקדים השונים, סיכום המידע, כולל הפנייה למקורות, גיבוש תובנות והמלצות המתאימות ל"שאלת המחקר" של המשתמש ולבסוף, כתיבת דו"ח ערוך כמקובל במחקרי ספרות אקדמיים.

כמות משתמשים חודשית - של מודל ג'מיני

קצב אימוץ השימוש בג'מיני מאוד מושפע מהכלים הרבים שיש ל"גוגל", מצד אחד ומהיבטים רגולטוריים, מצד שני. סיכון גבוה במיוחד - הם הדיונים של הממשל בארצות הברית בהקשר לצורך לפצל את "גוגל". נכון לאפריל 2025 - יש למודל כ-350 מיליון משתמשים חודשיים ייחודיים.

במסגרת הופעה של מנכ"ל גוגל, סונדאר פיצ'אי, בסוף אפריל 2025, הוא ציין שהחברה תשקיע 75 מיליארד דולר בחומרות "ענן מחשוב" כדי לתמוך את השימוש של המשתמשים ברחבי העולם - בזמן אמיתי. החברה, בין השאר לטובת צרכים אלה, הכריזה גם על פיתוח TPU חדש שנקרא IronWood והוא מהווה קפיצת מדרגה בביצועי החומרה שמיוצרת על ידי גוגל. Ironwood הוא הגרסה השביעית של צ'יפים ייעודיים לבינה מלאכותית TPU והוא פותח במיוחד כדי לתמוך הרצת מודלים בשלשב ההיסק - על ידי כמויות גדולות מאוד של משתמשים במקביל ובזמן אמיתי. ביצועי השבב טובים בערך פי 100 בהשוואה לדור הראשון והוא חסכני יותר בצריכת אנרגיה. לפי חוקרים רבים - מה שקובע את הדרישות בתחום החומרה, מ-2025 ואילך - תהיה הדרישה לתמוך מיליארדי משתמשים שיפעילו בו-זמנית מודלי בינה מלאכותית המצריכים חישוב בזמן אמיתי - באמצעות בפעלה של יישומים על גבי התקנים ממגוון סוגים, כמו טלפונים סלולריים, משקפי מציאות רבודה, מחשבים ביתיים, רובוטים וכדומה. לפי מנכ"ל חברת גוגל, ג'מיני המעודכן מצטיין בביצוע סימולציות של מערכות פיזיות. החברה גם עידכנה כי רשת המסעדות "מקדונלד'ס" אימצה את טכנולוגיית ג'מיני כדי לשפר את השירות שהיא נותנת ללקוחותיה.

באפריל 2025 - החברה גם שחררה את התכונה שמאפשרת לג'מיני לנתח ווידאו שמוזרם אליו ברציפות ובזמן אמיתי, למשל, באמצעות מצלמת הטלפן הנייד. תכונה זו מתחברת למאמצים של החברה לפתח "מענה שלם" לתחום הרובוטיקה ובכלל זה משפחת מודלי שפה "מרובי סוג קלט" (multimodal) בכך, ג'מיני הפך גם ל“מוח” ולשכבת “השכל הישר” ב"ערכת הבינה לרובוטיקה" החדשה של Google DeepMind. בעזרת עידון המודלים (fine-tuning) של Gemini על מידע מצטבר מחיישנים של רובוטים ובסימולציות פיזיקליות מעוגנות-מציאות, פיתחה DeepMind את Gemini Robotics ואת Gemini Robotics-ER, מודלים המאפשרים לרובוטים להבין פקודות מילוליות, לקלוט את סביבתם, לתכנן משימות רב-שלביות ולפעול בבטחה בעולם האמיתי – החל מקיפול אוריגמי ועד פתיחת פקקי-בקבוקים.

קישורים חיצוניים

הערות שוליים

  1. Google Builds on Tech's Latest Craze With Its Own A.I. Products, באתר הניו יורק טיימס, 10 במאי 2023 (באנגלית)
  2. Every major AI feature announced at Google I/O 2023, באתר ZDNet,‏ 10 במאי 2023 (באנגלית)
  3. Sundar Pichai on Google;s AI, Microsoft's AI, OpenAI, and ... Did We Mention AI? באתר Wired, ‏11 בספטמבר 2023 (באנגלית)
  4. Google Announces AI System Gemini After Turmoil at Rival OpenAI, באתר וול סטריט ג'ורנל, 6 בדצמבר 2023 (באנגלית)


הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

Gemini (מודל שפה)41155425Q123688361