5 דברים שמחוללי תמונות בינה מלאכותית עדיין נאבקים בהם

מחוללי תמונות בינה מלאכותית כמו דאל-אי, דיפוזיה יציבה, אמצע מסע, ו Bing Image Creator לייצר תוצאות מדהימות, אבל לפעמים הן יכולות להיות מתסכלות להפליא. בעזרת הנחיות פשוטות המכילות רק כמה מילים, בינה מלאכותית יכולה להוציא תמונות מרשימות שנראות כתמונות מקצועיות ואמנות משכנעת בסגנונות שונים. עם זאת, אותה הנחיה תיצור מדי פעם יצור מחריד או עיבוד פגום בצורה מצחיקה.

תוכן

  • סלט ידיים וכדורי אצבעות
  • טקסט וכתיבה מטרידים
  • לעיניים אין את זה
  • כלים בעייתיים
  • שיני סיוט
  • אמנות AI משתפרת במהירות

הנחיות שליליות עשויות לעזור להפחית את הסבירות לשגיאות אלו, אך מורכבות לא תמיד יכולה להציל אותך. אפילו מומחי בינה מלאכותית נאבקים עם יצורים מעוותים וסצינות בלתי עולמיות, הדורשות שעות ארוכות של חידוד הנחיות או חידוש תמונות עם עורך תמונות מסורתי. לעת עתה, אם תסתכל היטב באזורים הנכונים של תמונה, יש סיכוי טוב שתוכל לזהות אם היא נוצרה על ידי מכונה.

סרטונים מומלצים

סלט ידיים וכדורי אצבעות

מפתחי בינה מלאכותית התקדמו במאבק ללמד כלי בינה מלאכותית כיצד ידיים אנושיות צריכות להיראות, אבל יש הרבה מקום לשיפור. אם האצבעות אינן מוצגות בצורה בולטת, קל לפספס שגיאות, אבל זו בעיה מתמשכת.

קָשׁוּר

  • דיפוזיה יציבה שואפת לתקן את הבעיה עם יצירת אצבעות
  • סרטונים שנוצרו על ידי AI הגיעו והם מתפתחים במהירות
  • Bing Image Creator מביא תמונות שנוצרו על ידי DALL-E AI לדפדפן שלך
Dall-E היה מנהיג AI מוקדם אבל ידיים זה לא הקטע שלו.
Dall-E היה מנהיג AI מוקדם, אבל ידיים זה לא הקטע שלו.Dall-E בהנחיית אלן באמת

אחד ממחוללי תמונות AI הראשונים והטובים הזמינים לציבור, Dall-E של OpenAI, יצר את התמונות האלה של אנשים מחזיקים ידיים. במבט ראשון, זה עשוי להיראות בסדר. בבדיקה מעמיקה יותר, כמה בעיות מתגלות. היזהרו מאצבעות נוספות, ציפורניים מוזרות וספרות ממוזגות.

אחיזות מסובכות ואצבעות שלובות הן אפילו מאתגרות יותר. אל תתפלאו אם תמונות ה-AI שלכם יחזרו עם תקלות קלאסיות המכונות "סלט ידיים" או "כדורי אצבעות".

הידיים המשולבות של דאל-אי מטרידות.
הידיים המשולבות של Dall-E מטרידות.Dall-E בהנחיית אלן באמת

טקסט וכתיבה מטרידים

אתה עשוי לצפות שהטקסט יהיה קל למחשב ליצור. אתה רואה עדויות למילים על המסכים מדי יום כשאתה מרים את הטלפון או פותח דפדפן. מחשבים מוקדמים, בניגוד מחשבי הגיימינג המובילים של היום, לא יכול היה להציג גרפיקה מכל סוג שהוא. הכל היה טקסט או מספרים.

לאונרדו AI מכיר סגנונות אבל טקסט מודפס הוא מאתגר.
לאונרדו AI מכיר סגנונות, אבל טקסט מודפס הוא מאתגר.לאונרדו AI בהנחיית אלן באמת

עם זאת, הצגת אותיות וסמלים אמיתיים כמילים מודפסות או כתובות היא מסובכת באופן מפתיע עבור א מחולל תמונות AI. זה אולי נשמע כמו בעיה שקל לפתור, אבל זה לא. אפליקציה לא יכולה רק לכסות טקסט רגיל. כדי להיות משכנע, סגנון הטקסט, ההצללה, הזווית והפרספקטיבה חייבים להתאים לשאר הסצנה.

בדוגמה, מחולל תמונות AI חדש יחסית, Leonardo AI, עשה מאמץ אמיץ עם שלט חוצות וינטג' למסעדה של ג'ק ראביט סלים. לאחר נסיונות מרובים, הבינה המלאכותית הצליחה לאיית את "של ג'ק ראביט", וזה די קרוב לבקשה. סגנון הצילום הווינטג' היה נקודתי בכל תמונה, אבל האותיות והמילים היו לרוב פגומות.

Leonardo AI התקרב ליצירת טקסט נכון באחד מהעיבודים הללו.
Leonardo AI התקרב לקבל טקסט נכון בעיבוד בצד שמאל.עיבוד הבינה המלאכותית של לאונרדו בהנחיית אלן באמת

לעיניים אין את זה

Bing Image Creator נאבק בעיניים.
Bing Image Creator בהנחיה של Alan Truly

לעתים קרובות אומרים שהעיניים הן החלונות לנשמה. אנו מסתמכים כל כך על קשר עין שזה יכול להיות הפרט הקריטי ביותר ביצירת דיוקן ריאליסטי. אבל כלים רבים של AI מתקשים בעיבוד עיניים אנושיות.

Bing Image Creator עשה עבודה לא רעה עם רקע הסטודיו והציג תמונה משפחתית רב-דורית. עם זאת, כמעט לכל אדם יש עיניים מוזרות שנראות כאילו הוכנסו על ידי חייזרים, או אולי האנשים המחייכים האלה נמצאים בתהליך של הפיכת ליצורים לא-ארציים.

שתי דוגמאות קרובות יותר לבעיות העיניים של Bing Image Creator.
שתי דוגמאות קרובות יותר לבעיות העיניים המטרידות של Bing Image Creator.Bing Image Creator בהנחיה של Alan Truly

כלים בעייתיים

בני אדם מצוינים בכלים ולא רק במגוון הדיגיטלי כמו בינה מלאכותית. אנו שולטים במהירות בכל כלי פיזי שנמצא בהישג ידנו. AI, לעומת זאת, מתקשה להבין מה הם וכיצד משתמשים בהם.

מידג'ורני מבין ידיים אבל מבולבל על ידי מפתח ברגים.
מידג'ורני מבין ידיים, אבל מבולבל על ידי מפתח ברגים. האם זו נורה בפינה השמאלית התחתונה?Midjourney בהנחיית אלן באמת

Midjourney הוא מחולל תמונות בינה מלאכותית שמתקדם בצורה מדהימה בפתרון בעיות עם פנים וידיים אנושיות. עם זאת, כאשר מתבקשים להראות למכונאי מהדק בורג עם מפתח ברגים, הכלי נעדר לחלוטין. במקרה אחד מוסיפים ציפורניים לכפפות, ובמקרה אחר מופיעה איכשהו נורה.

מספריים מסובכות מדי עבור Bing Image Creator בעיבוד תקריב זה של שיער שנחתך. הם פתוחים רק בתמונה אחת ולעולם לא נראה שהם בפעולת חיתוך.

Bing Image Creator לא מצליח להבין מספריים.
Bing Image Creator לא מצליח להבין איך מספריים פועלות.Bing Image Creator בהנחיה של Alan Truly

שיני סיוט

לעיבודי פיזור יציב של חיוכים יש לפעמים יותר מדי שיניים.
דיפוזיה יציבה באמצעות Leonardo AI, בהנחיה של Alan Truly

כשאנשים מחייכים וצוחקים, זה בדרך כלל משפר תמונה, עושה אותה נעימה ומהנה. כאשר מקבלים הנחיה פשוטה כמו שני תלמידים מחייכים וצוחקים, AI יכול להפוך את זה לדלק סיוט עם מספר שורות של שיניים ועיוותים מוזרים אחרים.

Leonardo AI מאפשר לך לבחור בין מספר דגמים, וחלקם מטפלים היטב בשיניים. הפופולרי דגם Stable Diffusion 2.1 נזקק לעזרה כדי לתקן את השיניים. עם כמה הנחיות שליליות, הבעיה נפתרה. יש פתרונות לבעיות תמונה בינה מלאכותית, אך עדיין נדרשת עבודה כדי להשיג תוצאות טובות.

חיוכים של דיפוזיה יציבים נהנים מהנחיות שליליות.
חיוכים של דיפוזיה יציבה נהנים מהנחיות שליליות להסרת "שיניים מוזרות" ו"פה מעוות".דיפוזיה יציבה באמצעות Leonardo AI, בהנחיה של Alan Truly

אמנות AI משתפרת במהירות

בימים הראשונים של אמנות הבינה המלאכותית, התוצאות היו מוזרות ונפלאות, ויצרו יופי ואימה בנטישה שווה. השגיאות הופכות פחות בולטות עם כל עדכון חדש, וניתן להתגבר על בעיות רבות בעזרת חידוד מסוים.

עם כל כך הרבה כלי AI זמינים, קל לנסות מערכת אחרת. מחוללי תמונות AI רבים מאפשרים הנחיות שליליות או אפשרויות אחרות להתאים את האלגוריתם ולקבל תוצאות טובות יותר.

ייתכן שתצטרך לעבור מספר ניסיונות כדי לקבל תמונה שמישה, במיוחד אם יש התמקדות בפנים או בידיים. כאשר אתה רוצה לכלול מילים מודפסות או כתובות, היה מוכן לבלות זמן בעורך תמונות במחיקת אותיות השטויות של ה-AI ושילוב הטקסט הנכון.

החדשות הטובות הן שמחוללי תמונות בינה מלאכותית רבים הם בחינם, ודגמי מנויים זולים יחסית. בתוך שנה, ניתן לפתור את הבעיות המתמשכות הללו, ולאפשר לך להשתמש בעיבוד AI כיצירת אמנות מוגמרת או תחליף לצילום.

המלצות עורכים

  • תכונת ההתרחקות החדשה של Midjourney הופכת לסנסציית הבינה המלאכותית הגדולה הבאה
  • ה-Bing Chat המעודכן מקפיץ את ChatGPT ב-6 דרכים חדשות וחשובות
  • תמונת AI ויראלית זו הטעתה את העולם, ואולי כבר ראית אותה
  • מחולל AI חדש דמוי ChatGPT של Grammarly יכול לעשות הרבה יותר מאשר להגיה את הכתיבה שלך
  • ראיתי את העתיד (הרחוק) של חיפוש AI באינטרנט - כאן זה מדהים, והיכן הוא נאבק

שדרג את אורח החיים שלךמגמות דיגיטליות עוזרות לקוראים לעקוב אחר עולם הטכנולוגיה המהיר עם כל החדשות האחרונות, ביקורות מהנות על מוצרים, מאמרי מערכת מעוררי תובנות והצצות מיוחדות במינן.