LAION
Laion הוא פרויקט מאגרי תמונות החופשי הגדול בעולם. הפרויקט מכיל תמונות ומלל המתאר אותן. הפרויקט מיועד למחקר בתחום הראייה הממוחשבת ואימון רשתות נוירונים. בתחום לימוד המכונה, ככל שהמכונה מורכבת יותר ופחות מפוקחת, יש צורך ביותר נתונים כדי לאמן אותה, והמאגר מספק מענה לצורך זה של חוקרים רבים.
הפרויקט מכיל מספר מאגרים כשהגדול בהם נכון ל-2023 הוא ה-LAION5B המכיל כ-5.85 מיליארד תמונות עם תיאורי מלל תואמים. התמונות אינן שייכות ל-LAION ונאספו מרחבי האינטרנט על ידי זחלני רשת.[1] הפרויקט הינו פרויקט קוד פתוח. כל אחד מוזמן לבוא ולתרום לו כסף, משאבים או חומרה. השימוש במאגר חופשי לכל. המאגר נוצר באוגוסט 2021 על ידי Christoph Schuhmann, Jenia Jitsev, Richard Vencu ו-Robert Kaczmarczyk.[2][3]
אופן פעולה
LAION פרסמה בפומבי מספר מערכי נתונים גדולים של צמדי כיתוב תמונה, שנעשה בהם שימוש נרחב על ידי חוקרי בינה מלאכותית. המאגר החופשי הגיע לקנה מידה של מאגרי המידע של החברות הגדולות בתחום בזכות אופן הפעולה שלו. הנתונים נקצרים מה - Common Crawl, מערך נתונים של דפי אינטרנט קיימים. המפתחים חיפשו ב-html הסרוק אחר תגיות <img>
והתייחסו לתכונות ה-alt שלהם ככתוביות. הם השתמשו במודל CLIP, שפותח ואומן על ידי OpenAI, כדי לסנן החוצה תמונות שהתוכן שלהן לא תואם את הכיתובים שלהן. LAION אינו מארח את התוכן של תמונות בעצמו; במקום זאת, מערך הנתונים מכיל כתובות URL המצביעות על תמונות, שעל החוקרים להוריד בעצמם.[1]
מערך הנתונים הראשון מסוג זה, LAION-400M, שוחרר באוגוסט 2021 והורכב מ-400 מיליון זוגות של כתוביות ותמונה. אלו הופקו מתת-קבוצה אקראית של דפי אינטרנט שאותרו על ידי Common Crawl בין 2014 ל-2021. עבודה זו בוצעה במטרה לשחזר את התהליך בו השתמשו ב-OpenAI כדי לאסוף את 400 מיליון צמדי הכיתוב ותמונה שהשתמשו בהם כדי לאמן את מודל ה-CLIP, מכיוון שהחברה שחררה כקוד פתוח את הקוד ואת המשקלים של המודל, אך לא את סט הנתונים ששימש לאימון שלו. Imagen, מודל טקסט לתמונה שהוכרז על ידי Google Brain בשנת 2022, השתמש לצורך אימון ב-LAION-400M, בשילוב עם מערכי נתונים פנימיים פרטיים.[4]
המאגר אינו ממויין. כדי לחפש במאגר יש צורך בשימוש במודל CLIP, המקבל מילות תיאור ובודק לאיזה תמונות יש את התיאור המתאים.
OpenAssistant הוא עוזר מבוסס בינה מלאכותית (AI) מבוסס צ'אט שמבין משימות, יכול לקיים אינטראקציה עם מערכות צד שלישי ולאחזר מידע באופן דינמי כדי לעשות זאת. הפרויקט פותח על ידי קבוצת מתנדבים בשיתוף עם LAION. אחת ממטרות הפיתוח היא להשיג גישה חופשית למודל שפה גדול שניתן להפעיל באופן מקומי על חומרת קצה של הלקוח.[5] הפרויקט מגובה במאמץ עולמי של מיקור המונים הכולל למעלה מ-13,500 מתנדבים שיצרו 600,000 נקודות מידע שנוצרו על ידי אדם.[6]
היסטוריה משפטית
בפברואר 2023, LAION הוזכרה בתביעה של Getty Images נגד Stable Diffusion כמי שאינה צד.
באפריל 2023, LAION נתבעה ישירות על ידי צלם גרמני שביקש להסיר את התמונות שלו מהאתר.
ב-15 באפריל 2023, LAION ותורמים פרסמו לציבור קוד פתוח של עוזר AI צ'אטבוט OpenAssistant.[7]
סוגיי מאגרים בפרויקט
- Watermark Detection
- Audio Dataset
- LAION-3D
- LAION Aesthetics
- LAION5B High-Res
- Clip H/14
- Laion translated
- Laion-coco
- LAION5B
- LAION-400M
קישורים חיצוניים
- אתר האינטרנט הרשמי של LAION
- עוד על הפרויקט, באתר (LAION)
הערות שוליים
- ^ 1.0 1.1 Hessie Jones, Amid Growing Call To Pause AI Research, LAION Petitions Governments To Keep AGI Research Open, Active And Responsible, Forbes (באנגלית)
- ^ LAION site
- ^ LAION-5B: An open large-scale dataset for training next generation image-text models, Cornell University
- ^ Christoph Schuhmann, Romain Beaumont, Richard Vencu, Cade W. Gordon, Ross Wightman, Mehdi Cherti, Theo Coombes, Aarush Katta, Clayton Mullis, Mitchell Wortsman, Patrick Schramowski, Srivatsa R. Kundurthy, Katherine Crowson, Ludwig Schmidt, Robert Kaczmarczyk, Jenia Jitsev, LAION-5B: An open large-scale dataset for training next generation image-text models, 2022-09-17
- ^ Open-Assistant, LAION AI, 2023-03-09, נבדק ב-2023-03-09
- ^ "Open Assistant: Explore the Possibilities of Open and Collaborative Chatbot Development". KDnuggets (באנגלית אמריקאית). נבדק ב-2023-05-05.
- ^ Matthias Bastian, LAION urges open AI models with continued rapid innovation, THE DECODER, 2023-04-09 (באנגלית אמריקאית)
36791586LAION