השבוע שהיה בבינה המלאכותית היוצרת

1. חברת OpenAI מכוונת לליבת היצירתיות של הוליווד.

חברת OpenAI במהלך משולב משחררת סדרה של סרטונים שיוצרו על ידי יוצרי רשת וסטודיו מובילים, וזאת לצד דיווח בבלומברג שבסוף פברואר OpenAI קבעה שיחות היכרות בהוליווד בראשות ה-COO בראד לייטקאפ עם מספר אולפנים במטרה ליצור שותפויות בתעשיית הבידור ולעודד יוצרי סרטים לשלב את מחולל הווידאו Sora בעבודתם.

השבוע עלה באתר החברה דף אשר מציג התרשמות ראשונית של מספר יוצרים שעשו שימוש בSora בכדי ליצור סיפורים ויזאוליים (סרטונים) קצרים. ב OpenAI מציינים כי ישנן שיפורים רבים לבצע ב-Sora, אך כבר עכשיו ניתן לראות את הפוטנציאל של המודל בסיוע ליוצרים להפוך רעיונות למציאות.

לרשימה לחצו כאן

2. דרמת המנכל מגיעה ל Stability AI – המנכ"ל אימד מוסטק התפוטר.

כמו בסרט טוב, החברות שעוסקות ביצירת מודליGenAI כמרקחה, לפני מספר חודשים זו הייתה דרמה בדירקטוריון של OpenAI ועכשיו הדרמה מגיעה ל Stability AI. מי שעוקב יודע כבר זמן מה שלא רגוע שם. החברה שהגדירה את עצמה כחלוצת הקוד הפתוח בתחום ה GenAI ואכן לזכותה חלק משמעותי מהפיצוץ הענק של הבינה המלאכותית היוצרת בתחילת שנה שעברה, מדממת מזומנים כבר זמן רב.

עכשיו הגיע הזעזוע המשמעותי, אימד מוסטק המנכ"ל והמייסד של Stability AI התפטר ופרש ממועצת המנהלים של החברה. זו דרמה משמעותית שכן אם Stability AI תשנה כיוון ותפסיק לשחרר מודלי קוד פתוח, תעשיה שלמה של כלים מבוססי Stable diffusion תקרוס ותעלם ככל ששאר המודלים יתפתחו והמודלים ששוחרו בעבר יהפכו לפחות רלוונטיים ועדכניים.

במקביל החברה הודיעה על מספר עדכונים משמעותיים ב API של החברה בין היתר היכולת לערוך תמונות שנוצרו באמצעות AI הרחבת והחלפת אובייקטים בתמונה ועוד.

לידיעה המקורית לחצו כאן
לעדכוני הAPI לחצו כאן

3. שיתוף פעולה בין Musixmatch ו Runwayמאפשר יצירה של וידאו משירים.

הסכם שיתוף פעולה נתחם השבוע בין הסטרטאפ Runway המוכר וחברת טכנולוגיית המוזיקה האיטלקית Musixmatch. שיתוף פעולה זה מאפשר ליותר ממיליון מוזיקאים ואמנים המשתמשים ב-Musixmatch לגשת למנגנון יצירת הוידאו של Runway במטרה לאפשר ליוצרים להפוך את שיריהם לתוכן וידאו דינמי במהירות ובהתאמה לחזון היצירתי שלהם.

האמנים יוכלו ליצור וידאו תוך שימוש ב-Gen-2, שיתואם למילות השירים באמצעות פלטפורמת Musixmatch, ובכך להאיץ את תהליך יצירת הוידאו. התכונה זמינה רק לאמנים שמנויים בשירות בתשלום של Musixmatch, שעלותו החל מ-2.99 דולר לחודש.

לידיעה המקורית לחצו כאן

4. יוטיוב מחמירה את מדיניותה כלפי יוצרי תוכן בכל הנוגע לעשיית שימוש בAI.

יוטיוב מציגה מדיניות חדשה הדורשת מיוצרי תוכן להצהיר כאשר הם משתמשים בכלים של בינה מלאכותית גנרטיבית ביצירת שלהם, תוכן שעשוי להיראות כמציאותי. הכללים המעודכנים דורשים מיוצרי התוכן ביוטיוב לציין אם הווידאו שלהם מכיל תוכן שנוצר או משנה וידאו או אודיו של אנשים אמיתיים, מקומות או אירועים ריאליסטיים שנוצרו באמצעות כלים של בינה מלאכותית גנרטיבית או טכנולוגיית דיפפייק.

סימון בולט יותר עשוי להיות מוטבע בסרטוני וידאו שעוסקים בנושאים רגישים כמו חדשות ומידע בריאותי. המטרה היא להגביל את הפצת המידע המטעה באמצעות בינה מלאכותית. מדיניות זו נועדה להבטיח שקיפות ולמנוע שימוש לרעה בטכנולוגיית הבינה המלאכותית הגנרטיבית.

לידיעה המקורית לחצו כאן

5. ה Financial Times משיקים צ'אטבוט בשם "Ask FT" על בסיס קלוד של אנטרופיק.

הפייננשל טיימס משיקים צ'אטבוט בשם "Ask FT" המבוסס על בינה מלאכותית גנרטיבית. הצ'טבוט שהחדש מספק תשובות מותאמות לשאלות של מנויי העיתון ועל בסיס התוכן ופרסומים שנאספו בארגון במשך עשרות שנים.

למרות שמקור הידע הוא הפרסומים של העיתון בבדיקה של משתמשים, נמצא חוסר עקביות בחלק מהתשובות. לדוגמא, בתשובה לשאלה על מי מתמודד לנשיאות ארה"ב לשנת 2024, נכללו שמות של מועמדים שכבר פרשו מהמירוץ. כמו כן, הצ'אטבוט עדיין נמצא בשלב הבטא וזמין רק למנויים משלמים.

הצ'ט בוט Ask FT מופעל על ידי מודל השפה ה "קלוד" שפותח על ידי Anthropic. העיתון מתייחס לפרוייקט כפיילוט שנועד לבחון איזה סוג של שירות ייצר ערך ללקוחותיו. הצ'אטבוט יכול להגיב לשאלות על אירועים נוכחיים ושאלות רחבות יותר, כולל סריקה של ידיעות ישנות בארכיון.

לידיעה המקורית לחצו כאן

6. סטארטאפ האווטריםHeyGen משיק את גרסה 5.0 עם מגוון רחב של שיפורים.

אני מודה ש HeyGen הוא אחד הכלים החבבים עלי, ראשית קצב ההתפתחות והחידושים שבו לא פחות ממדהימים, שנית לטעמי הוא מציג את האווטרים הראליסטיים ביותר. עכשיו עם הגרסה החדש 5.0 החברה מציגה מספר חידושים.

ראשית החברה מציגה את הגרסה השלישית לסטודיו עריכת הוידאו שלה, הממשק מגיע עם יכולות משופרות הכוללות עריכה נוחה יותר של האווטרים, שילוב קול ואובייקטים נוספים. עריכת התסריט עברה לצד שמאל והטיים־ליין שודרג ויכול להכיל מספר שכבות וערוצים לצד טיפול במגוון קבצים, צורות ועיצובים.

אווטר הלייב סטרים שודרג והוא מאפשר שיח בזמן אמת עם אווטאר שמחובר לChatGPT של OpenAI כך שהשיח עם המודל של OpenAI מקבל גוף ופנים. בנוסף שודרגו יכולות התרגום בין שפות, יצירת אווטרים פרסונאליים ועוד.

אך גֻּלַּת הכותרת הוא האווטר המציאותי שיכול לנוע בוידאו על רקע משתנה – בהחלט שווה הצצה בקישור הבא.

לוידאו ההשקה לחצו כאן

7. המרדף אחר עתיד החיפוש: גוגל מול OpenAI ומיקרוסופט.

לאחר שנים, סוף סוף יש ניצנים של תחרות בשוק החיפוש ברשת. מיקרוסופט ו OpenAI עושות קולות של מחקר והשקה של מנועי חיפוש מבוססי GenAI שיתחרו בגוגל, וזו מצידה מנסה לשמור על מעמדה הבלתי מעורער. בשנה שעברה גוגל השיקה את חוויית החיפוש הגנרטיבית שלה אשר כוללת תשובות ישירות ממודל הנפשה של Bard ואפשרויות אינטראקטיביות כמו שאלות המשך ודיאלוגים דמויי צ'אטבוט מעל תוצאות החיפוש.

לאחרונה גוגל החלה לבצע ניסויים של סיכומים שנוצרו על ידי בינה מלאכותית בתוצאות החיפוש הראשיות בארה"ב לשאילתות מורכבות יותר גם למשתמשים שלא נרשמו ל"חוויית החיפוש הגנרטיבית".
המטרה של גוגל היא לקבל משוב ממשתמשים שלא הפעילו במפורש את החוויה הגנרטיבית, כדי ללמוד האם קהל רחב יותר מוצא את הטכנולוגיה שימושית. למרות שהשירות נמצא בשלבים מתקדמים של שימוש ובדיקה על ידי משתמשים, עדיין לא ידוע מתי גוגל תשיק את החיפוש הגנרטיבי באופן מלא.

לידיעה המקורית לחצו כאן

8. רמזים לעדכונים העתידיים ב Chat-GPT ו Dall-E מסתובבים ברשת.

המשתמש טיבור בלהו שמוכר כבר בתחזיות המדוייקות שלו לגבי המאפיינים החדשים של OpenAI פרסם תמונות מסך המעידות על כך ש OpenAI מתכננת להשיק תכונות חדשות למודלים GPT-4 ו-DALL-E 3. בין היתר, ייתכן שהגבלת ההודעות ב-GPT-4 תיעלם. זאת על בסיס תצוגה מוקדמת של ChatGPT, בה הוא מצא מתג חדש שמאפשר להגביל הודעות במקום הגבלה קבועה.

בנוסף הוא גם הציג כפתור "Model Tuner Selector", שנועדה לחלק באופן חכם בקשות בין GPT-4 ל-GPT-3.5 כדי לחסוך בזמן עיבוד ובמכסת הבקשות של GPT-4. בנוסף, OpenAI מבצעת ניסוי עם מאפיין "תגובה משודרגת", שתאפשר למשתמשים לשדרג תגובות מ-GPT-3.5 ל-GPT-4 בלחיצת כפתור. ייתכן כי OpenAI מנסה למשוך יותר משתמשים לגרסה הבתשלום באמצעות כפתור זה.

בנוסף, DALL-E 3 צפוי לקבל עדכון חשוב עם עורך תמונות שכולל יכולת השלמת תמונה ועריכה מבלי לצאת מהצ'ט וזאת לצ'ד המשך שינוי התמונה באמצעות שיח עם הצ'ט שעובר לצאת בעוד התמונה נשארת במרכז.

בנוסף דיווחים שדלפו מצביעים על כך ש OpenAI מתכוננת לחשוף את GPT-5, הדור הבא של מודל השפה הגדול שלה, בחודשים הקרובים. GPT-5 צפוי להשתחרר בקיץ וכבר הוצג לחלק מלקוחות העסקיים של OpenAI. על פי הדיווחים, היו שיפורים משמעותיים ב GPT-5 לעומת GPT-4, שהושק במרץ האחרון.

ההדגמות הציגו שימושים ספציפיים לחברות וחשפו סוכנים אוטונומיים ותכונות חדשות נוספות. כרגע, OpenAI עסוקה בתהליך אימון GPT-5, אחריו יתקיימו בדיקות בטיחות ובקרת איכות, כולל "רד טימינג", בו עובדים וגורמים חיצוניים ינסו לזהות בעיות או פגמים לפני שהמודל יהפוך לזמין לציבור.

לידיעה המקורית לחצו כאן או כאן
לקישור נוסף לחצו כאן

9. ושוב, סטנדרט חדש למודלי שפה בקוד פתוח – מגה מודל מבית databricks / מוזיאק.

ושוב השיא למודלי שפה מבוססי קוד פתוח נפרץ – חברת Databricks שרכשה את הסארטאפ מוזיאק מציגה את DBRX, מודל שפה חדש אשר עושה שימוש בארכיטקטורת של המשלבת 16 מומחים עם 132 מיליארד פרמטרים, מתוכם 36 מיליארד פעילים. המודל אומן על 12 מיליארד טוקנים של טקסט ונתוני קוד, והוא ללא ספק המודל המוביל עד כה בתחום המודלים הפתוחים עם שיא ביצועים במשימות RAG.

בהשוואה למודלים פתוחים אחרים, DBRX מוביל בבדיקות איכות במגוון תחומים כולל תכנות, מתמטיקה ו-MMLU, והוא זמין לשימוש עבור לקוחות databricks דרך API. כאמור המודל גם שוחרר בקוד פתוח וניתן לגשת אליו ב huggingface.

לידיעה המקורית לחצו כאן
לקישור למודל ב huggingface לחצו כאן

השבוע שהיה בבינה המלאכותית היוצרת 28/03/2024

מאמרים קשורים

נושאים מרכזיים