לדלג לתוכן

מודל טקסט לווידאו

מתוך המכלול, האנציקלופדיה היהודית

מודל טקסט לווידאואנגלית: Text-to-video model) הוא מודל בינה מלאכותית יוצרת המייצר סרטוני וידאו באמצעות תיאור טקסט של המשתמש.[1] מודלים אלו השתפרו משמעותית באיכות ובמהירות מתחילת 2020. מודל דיפוזיה סייע משמעותית בפיתוח מודלים אלו.[2]

דרך פעולה

מודל טקסט לווידאו פועל בצורה דומה לזו של מחולל תמונות. הוא עושה זאת תוך הרצת תיאור המשתמש ברשת נוירונים חוזרת (RNN) ורשת זיכרון לטווח קצר (LSTM). מאז 2020, מודל דיפוזיה, מודל גנרטיבי ללמידת מכונה, נמצא בשימוש נרחב במודלים של טקסט לווידאו.

מודלים

סורה

ערך מורחב – סורה (מודל טקסט לווידאו)

סורה (במקור: Sora) הוא מודל טקסט לווידאו של חברת מחקר הבינה מלאכותית OpenAI. מודל זה משתמש בטכנולוגיית בינה מלאכותית כדי ליצור סרטונים על סמך הנחיות טקסטואליות תיאוריות, וכן להרחיב סרטונים קיימים קדימה או אחורה בזמן.[3][4] המודל זמין למנויי ChatGPT Plus מדצמבר 2024.[5]

Veo

ערך מורחב – Veo (מודל טקסט לווידאו)

Veo (ידוע גם כ-Google Veo) הוא מודל טקסט לווידאו שפותח על ידי Google DeepMind והוכרז בחודש מאי 2024. כמודל בינה מלאכותית יוצרת, המודל יוצר סרטוני וידאו לפי הפרומפט ששולח המשתמש.

Runway

Runway AI היא חברה אמריקאית, המתמחה בבינה מלאכותית יוצרת. החברה מתמקדת בעיקר ביצירת מוצרים ומודלים להפקת סרטונים, תמונות ותכני מולטימדיה שונים. בפרט דגמי ה-AI המסחריים של טקסט לווידאו AI Gen-1,‏ Gen-2 ו-Gen-3 Alpha.

ב-21 בדצמבר 2022 גייסה Runway 50 מיליון דולר[6] בסבב C. ואחריו סבב הרחבה של 141 מיליון דולר של סדרה C ביוני 2023 לפי שווי של 1.5 מיליארד דולר[7][8] מגוגל, אנבידיה וסיילספורס[9] לבניית מודלים רב-מודאליים בסיסיים של AI ליצירת תוכן שישמשו בהפקת סרטים ווידאו.[10][11]

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא מודל טקסט לווידאו בוויקישיתוף

הערות שוליים

  1. AI Index | Stanford HAI, hai.stanford.edu (באנגלית)
  2. Melnik, Andrew; Ljubljanac, Michal; Lu, Cong; Yan, Qi; Ren, Weiming; Ritter, Helge (2024-11-17), Video Diffusion Models: A Survey, doi:10.48550/arXiv.2405.03150, נבדק ב-2026-02-26
  3. Metz, Cade (15 בפברואר 2024). "OpenAI Unveils A.I. That Instantly Generates Eye-Popping Videos". The New York Times. ארכיון מ-15 בפברואר 2024. נבדק ב-15 בפברואר 2024. {{cite news}}: (עזרה)
  4. Brooks, Tim; Peebles, Bill; Holmes, Connor; DePue, Will; Guo, Yufei; Jing, Li; Schnurr, David; Taylor, Joe; Luhman, Troy (15 בפברואר 2024). "Video generation models as world simulators". OpenAI. ארכיון מ-16 בפברואר 2024. נבדק ב-16 בפברואר 2024. {{cite web}}: (עזרה)
  5. Gerui Wang, "How Sora And AI Videos Transform Media: Strengths And Challenges, Forbes, December 12, 2024
  6. Cai, Kenrick. "Runway Raises $50 Million At $500 Million Valuation As Generative AI Craze Continues". Forbes (באנגלית). נבדק ב-2023-09-15.
  7. "AI Video Startup Runway Raises $141 Million From Google, Nvidia". Bloomberg.com (באנגלית). 2023-06-29. נבדק ב-2023-09-15.
  8. Wiggers, Kyle (2023-06-29). "Runway, a startup building generative AI for content creators, raises $141M". TechCrunch (באנגלית). נבדק ב-2023-09-15.
  9. "Google Invests in AI Startup Runway to Wrest Cloud Business From AWS". The Information. נבדק ב-2023-09-15.
  10. Black, Julia. "'Not Everyone Is Trying to Build God': Runway CEO Cristóbal Valenzuela Tries to Dampen the Doomerism". The Information. נבדק ב-2023-09-15.
  11. "Featured interview: Runway AI CEO Chris Valenzuela - First Move with Julia Chatterley - Podcast on CNN Audio". CNN (באנגלית). נבדק ב-2023-09-18.


מודל טקסט לווידאו42852824Q115517227