החלופות הטובות ביותר של ChatGPT (על פי ChatGPT)

ChatGPT הפך במהרה ליקיר הבינה המלאכותית הגנרטיבית, אבל זה כמעט לא השחקן היחיד במשחק. בנוסף ל כל שאר כלי הבינה המלאכותית שיש בחוץ שעושים דברים כמו יצירת תמונות, יש גם מספר מתחרים ישירים עם ChatGPT - או לפחות כך הנחתי.

תוכן

Bing מאת מיקרוסופט
BERT מאת גוגל
מיינה מאת גוגל
רוברטה מאת פייסבוק
XLNet מאת גוגל
DialoGPT מאת Microsoft Research
ALBERT מאת גוגל
T5 של גוגל
CTRL של Salesforce
GShard מאת גוגל
בלנדר מאת Facebook AI Research
פגסוס מאת גוגל

למה לא לשאול את ChatGPT על זה? זה בדיוק מה שעשיתי כדי לקבל את הרשימה הזו, בתקווה למצוא כמה אפשרויות עבור אלה מול הודעות "ביכולת"., או אחרים שרק רוצים לנסות משהו חדש. לא כל אלה נגישים לציבור כמו ChatGPT, אבל לפי ChatGPT, אלו הן האלטרנטיבות הטובות ביותר.

סרטונים מומלצים

Bing מאת מיקרוסופט

לפני שנכנסים לבחירות המפורטות על ידי ה-AI, האלטרנטיבה הטובה ביותר ל-ChatGPT היא, ובכן, ChatGPT. מיקרוסופט לאחרונה הוסיף את ה-AI למנוע החיפוש שלו בינג, והוא מתכנן להפיץ את התכונה לדפדפן Edge בקרוב.

קָשׁוּר

יצרנית ChatGPT OpenAI עומדת בפני חקירה של FTC על חוקי הגנת הצרכן

צמיחת השיא של ChatGPT הודחה זה עתה על ידי אפליקציה ויראלית חדשה
OpenAI בונה צוות חדש כדי לעצור בינה מלאכותית סופר אינטליגנטית

זה רק בתצוגה מקדימה, אבל אתה עדיין יכול לנסות את הצ'אטבוט החדש של AI ב bing.com/new עכשיו. מיקרוסופט אומרת שהיא מגבילה את מספר השאילתות בתחילה, אבל אתה יכול הצטרף לרשימת ההמתנה של Bing ChatGPT לקבל הודעה כאשר הגרסה המלאה תהיה זמינה.

BERT מאת גוגל

BERT (ייצוגי קודן דו-כיווני מרובוטריקים) הוא מודל למידת מכונה שפותחה על ידי גוגל. הרבה מהתוצאות של ChatGPT הזכירו פרויקטים של גוגל, שתראו בהמשך ברשימה זו.

BERT ידוע ביכולות עיבוד השפה הטבעי (NLP) שלו, כגון מענה על שאלות וניתוח סנטימנטים. היא משתמשת ב-BookCorpus ובוויקיפדיה האנגלית כמודלים שלה להפניות הדרכה, לאחר שלמדה 800 מיליון ו-2.5 מיליארד מילים בהתאמה.

BERT הוכרז לראשונה כעל פרויקט מחקר בקוד פתוח ו עבודה אקדמית באוקטובר 2018. הטכנולוגיה הוטמעה מאז בחיפוש גוגל. ספרות מוקדמת על BERT השווה אותו ל-ChatGPT של OpenAI בנובמבר 2018, וציין שהטכנולוגיה של גוגל היא דו-כיוונית עמוקה, מה שעוזר בחיזוי טקסט נכנס. בינתיים, OpenAI GPT הוא חד-כיווני ויכול להגיב רק לשאילתות מורכבות.

מיינה מאת גוגל

מינה היא צ'אטבוט זה גוגל הציגה בינואר 2020 עם היכולת לשוחח בצורה אנושית. דוגמאות לפונקציות שלו כוללות שיחות פשוטות הכוללות בדיחות מעניינות ומשחקי מילים, כמו מינה שמציעה לפרות ללמוד "מדעי הבקר" בהרווארד.

כחלופה ישירה ל-GPT-2 של OpenAI, ל-Meina הייתה היכולת לעבד פי 8.5 נתונים מהמתחרה שלה באותה תקופה. הרשת העצבית שלה כוללת 2.6 פרמטרים והיא מאומנת בשיחות מדיה חברתית ברשות הרבים. Meena קיבלה גם ציון מטרי ב-Sensibleness and Specificity Average (SSA) של 79%, מה שהופך אותו לאחד הצ'אטבוטים החכמים ביותר של זמנו.

קוד Meena זמין ב- GitHub.

רוברטה מאת פייסבוק

רוברטה (Robustly Optimized BERT Pretraining Approach) היא גרסה מתקדמת נוספת של BERT המקורי, אשר הודיעה פייסבוק ביולי 2019.

פייסבוק יצר את מודל ה-NLP הזה עם מקור נתונים גדול יותר כמודל ההכשרה שלו. רוברטה משתמשת ב-CommonCrawl (CC-News), הכוללת 63 מיליון מאמרי חדשות באנגלית שנוצרו בין ספטמבר 2016 לפברואר 2019, כמערך הנתונים שלה בנפח 76GB. לשם השוואה, BERT המקורי משתמש ב-16 ג'יגה-בייט של נתונים בין מערכי הנתונים של ויקיפדיה האנגלית ל-BookCorpus, לפי פייסבוק.

מסילימר ל-XLNet, רוברטה ניצחה את BERT בסט של מערכי נתונים בנצ'מרק, לפי המחקר של פייסבוק. כדי לקבל את התוצאות הללו, החברה לא רק השתמשה במקור נתונים גדול יותר, אלא גם הכשירה את המודל שלה עבור א פרק זמן ארוך יותר.

פייסבוק יצרה את רוברטה קוד פתוח בספטמבר 2019, והקוד שלו הוא זמין ב-GitHub לניסויים בקהילה.

VentureBeat הזכיר גם את GPT-2 בין מערכות הבינה המלאכותית המתפתחות במהלך אותה תקופה.

XLNet מאת גוגל

XLNET הוא מודל שפה אוטורגרסיבי מבוסס שנאי שפותח על ידי צוות של חוקרים מאוניברסיטת Google Brain וקרנגי מלון. הדגם הוא בעצם BERT מתקדם יותר והוצג לראשונה ביוני 2019. הקבוצה מצאה ש-XLNet הוא לפחות 16% יותר יעיל מאשר ה-BERT המקורי, שהוכרז ב-2018, כשהיא מסוגלת לנצח את BERT במבחן של 20 משימות NLP.

XLNet: שיטת אימון מקדים חדשה ל-NLP שמשפרת משמעותית את BERT ב-20 משימות (למשל, SQuAD, GLUE, RACE)

arxiv: https://t.co/C1tFMwZvyW

github (קוד + מודלים מאומנים מראש): https://t.co/kI4jsVzT1u

עם ז'ילין יאנג, @ZihangDai, יימינג יאנג, ג'יימי קרבונל, @rsalakhupic.twitter.com/JboOekUVPQ

- Quoc Le (@quocleix) 20 ביוני 2019

כאשר גם XLNet וגם BERT משתמשים באסימונים "מסוכיים" כדי לחזות טקסט מוסתר, XLNet משפרת את היעילות על ידי זירוז החלק החזוי של התהליך. למשל, אמזון אלכסה מדען נתונים Aishwarya Srinivasan הסביר ש-XLNet מסוגלת לזהות את המילה "חדש" כמשויכת למונח "היא עיר" לפני שהיא מנבאת את המונח "יורק" כמשויכת גם למונח זה. בינתיים, BERT צריך לזהות את המילים "ניו" ו"יורק" בנפרד ולאחר מכן לשייך אותן למונח "היא עיר", למשל.

יש לציין כי GPT ו-GPT-2 הם הוזכר גם במסביר זה מ-2019 כדוגמאות אחרות למודלים של שפה אוטורגרסיבית.

קוד XLNet ודגמים מאומנים מראש הם זמין ב-GitHub. המודל מוכר היטב בקרב קהילת מחקר ה-NLP.

DialoGPT מאת Microsoft Research

ה-DialoGPT (Dialogue Generative Pre-trained Transformer) הוא מודל שפה אוטורגרסיבית הוצג בנובמבר 2019 על ידי Microsoft Research. עם קווי דמיון ל-GPT-2, המודל הוכשר מראש כדי ליצור שיחה כמו אנושית. עם זאת, מקור המידע העיקרי שלו היה 147 מיליון דיאלוגים מרובי פניות שנגרדו משרשורי Reddit.

האוונגליסט הראשי HumanFirst קובוס גריילינג ציין הצלחתו בהטמעת DialoGPT בשירות ההודעות של טלגרם כדי להביא את המודל לחיים כצ'אטבוט. הוא הוסיף כי שימוש בשירותי האינטרנט של אמזון וב-Amazon SageMaker יכול לעזור בכוונון עדין של הקוד.

קוד DialoGPT זמין ב- GitHub.

ALBERT מאת גוגל

ALBERT (A Lite BERT) היא גרסה קטומה של BERT המקורי ופותחה על ידי גוגל בדצמבר 2019.

עם ALBERT, גוגל הגבילה את מספר הפרמטרים המותרים במודל על ידי הצגת פרמטרים עם "הטמעות שכבה נסתרת".

ביצועי מכונה באתגר RACE (הבנת הנקרא דמוי SAT) מאת Google

זה השתפר לא רק בדגם BERT אלא גם ב-XLNet ו-RoBERTa מכיוון שניתן לאמן את ALBERT אותה מערך נתונים גדול יותר של מידע המשמש לשני הדגמים החדשים יותר תוך הקפדה על דגמים קטנים יותר פרמטרים. בעיקרו של דבר, ALBERT עובד רק עם הפרמטרים הדרושים לתפקודים שלה, מה שהגדיל את הביצועים והדיוק. גוגל פירטה שהיא מצאה את ALBERT עולה על BERT ב-12 מדדי NLP, כולל אמת מידה של הבנת הנקרא SAT.

למרות שלא הוזכר בשמו, GPT נכלל בהדמיה של ALBERT בבלוג המחקר של גוגל.

גוגל פרסמה את ALBERT כקוד פתוח בינואר 2020, והוא יושם על גבי TensorFlow של גוגל. הקוד זמין ב- GitHub.

T5 של גוגל

T5 (Text-to-Text Transfer Transformer) הוא דגם NLP שהוצג על ידי גוגל בשנת 2019, אשר לווה ממגוון דגמים קודמים, כולל GPT, BERT, XLNet, RobERTa ו-ALBERT, בין היתר. זה מוסיף א מערך נתונים חדש וייחודי נקרא Colossal Clean Crawled Corpus (C4), המאפשר לשנאי לייצר באיכות גבוהה יותר ותוצאות הקשריות מאשר מערכי נתונים אחרים בהשוואה ל-Common Crawl web scrapes המשמשים XLNet.

אימון מקדים להעברת טקסט לטקסט של Google T5.

ההכשרה המוקדמת של T5 הובילה ליצירת אפליקציות צ'טבוט, כולל InferKit Talk To Transformer וה צינוק AI מִשְׂחָק. מחוללי הטקסט דומים ל-ChatGPT בכך שהם מאפשרים לך ליצור שיחות מציאותיות על סמך מה שה-AI מייצר לאחר ההנחיות או השאילתות הראשוניות שלך.

קוד T5 זמין ב- GitHub.

CTRL של Salesforce

CTRL של Salesforce (אמון חישובי ושכבת היגיון) היה אחד מדגמי השפה הגדולים ביותר שפורסמו לציבור כאשר זה הודע בספטמבר 2019 על ידי Salesforce. ניתן להשתמש במודל השפה של 1.6 מיליארד פרמטרים כדי לנתח גופי טקסט גדולים בו-זמנית, כגון אלו הקשורים לדפי אינטרנט. כמה שימושים מעשיים פוטנציאליים כוללים התאמה עם ביקורות, דירוגים וייחוסים.

מודל שפת ה-CTRL יכול להבדיל עד לסימני הפיסוק את הכוונה של שאילתה ספציפית. Salesforce ציין המודל יכול לקלוט את ההבדל בין "ההתחממות הגלובלית היא שקר". כדעה לא פופולרית ו"ההתחממות הגלובלית היא א שקר" כתיאוריית קונספירציה עקב הבדל התקופה בביטויים וניסוח שרשורי Reddit תואמים עבור כל אחד.

הפניות CTRL עד 140GB של נתונים להכשרה מוקדמת שלו ממקורות, כולל ויקיפדיה, פרויקט גוטנברג, ביקורות של אמזון ו-Reddit. הוא גם מתייחס למספר משאבי חדשות, מידע ומשאבי טריוויה בינלאומיים.

קוד ה-CTRL זמין ב- GitHub.

GShard מאת גוגל

GShard הוא א מודל תרגום שפה ענק זֶה גוגל הציגה ביוני 2020 למטרת קנה מידה של רשתות עצביות. המודל כולל 600 מיליארד פרמטרים, המאפשרים ערכות גדולות של אימון נתונים בבת אחת. GShard מיומן במיוחד תרגום שפה והוכשרה לתרגם 100 שפות לאנגלית בארבעה ימים.

בלנדר מאת Facebook AI Research

בלנדר הוא צ'אט בוט בקוד פתוח שהוצג ב אפריל 2020 מאת Facebook AI Research. הצ'אטבוט צוין כבעל כישורי שיחה משופרים בהשוואה למודלים של מתחרים, עם היכולת לספק נקודות דיבור מעורבות, הקשבה והפגנת הבנה של הקלט של בן הזוג שלה, והפגנת אמפתיה ואישיות.

בלנדר הושווה לצ'אטבוט Meena של גוגל, שבתורו הושווה ל-GPT-2 של OpenAI

קוד הבלנדר זמין ב- Parl.ai.

פגסוס מאת גוגל

פגסוס הוא מודל עיבוד שפה טבעית שהיה שהוצג על ידי גוגל בדצמבר 2019. ניתן לאמן את Pegasus ליצור סיכומים, ובדומה לדגמים אחרים כמו BERT, GPT-2, RoBERTa, XLNet, ALBERT ו-T5, ניתן לכוונן אותו למשימות ספציפיות. פגסוס נבדקה על יעילותה בסיכום חדשות, מדע, סיפורים, הוראות, מיילים, פטנטים והצעות חוק בהשוואה לנושאים אנושיים.

ה- PEGASUS NLP הושווה לאדם במונחים של איכות סיכום.

קוד Pegasus זמין ב- GitHub.

המלצות עורכים

Google Bard יכול עכשיו לדבר, אבל האם הוא יכול להטביע את ChatGPT?
ChatGPT: החדשות האחרונות, המחלוקות והטיפים שאתה צריך לדעת
תעבורת האתר ChatGPT ירדה לראשונה
תכונת הגלישה ב-Bing של ChatGPT מושבתת עקב ליקוי בגישה לקיר התשלום
צ'אטבוטי הבינה המלאכותית הטובים ביותר לנסות: ChatGPT, Bard ועוד