Nvidia Guardrails novērš lielu problēmu ar AI tērzēšanas robotiem

Nvidia ievieš savu jauno NeMo Guardrails rīku AI izstrādātājiem, un tas sola izveidot tādus AI tērzēšanas robotus kā ChatGPT tikai nedaudz mazāk ārprātīgs. Atvērtā pirmkoda programmatūra tagad ir pieejama izstrādātājiem, un tā koncentrējas uz trim jomām, lai padarītu AI tērzēšanas robotus noderīgākus un mazāk satraucošus.

Rīks atrodas starp lietotāju un lielo valodu modeli (LLM), ar kuru viņi mijiedarbojas. Tā ir drošība tērzēšanas robotiem, pārtverot atbildes, pirms tie sasniedz valodas modeli, lai apturētu modeļa reakciju vai sniegtu tai konkrētus norādījumus par to, kā reaģēt.

Bing Chat saka, ka vēlas būt cilvēks. — Jēkabs Ročs / Digitālās tendences

Nvidia saka, ka NeMo Guardrails koncentrējas uz aktuālām, drošības un drošības robežām. Šķiet, ka visnoderīgākais ir aktuālais fokuss, jo tas liek LLM palikt noteiktā atbilžu diapazonā. Nvidia demonstrēja Guardrails, parādot tērzēšanas robotu, kas apmācīts uzņēmuma personāla datu bāzē. Kad tika uzdots jautājums par Nvidia finansēm, tā sniedza gatavu atbildi, kas tika ieprogrammēta ar NeMo Guardrails.

Saistīts

Labākie autori pieprasa samaksu no AI firmām par viņu darba izmantošanu
GPT-4: kā izmantot AI tērzēšanas robotu, kas padara ChatGPT kaunā
Nvidia nevēlas, lai jūs zinātu par tās pretrunīgi vērtēto jauno GPU

Tas ir svarīgi daudzo tā saukto halucināciju dēļ, ko esam redzējuši no AI tērzēšanas robotiem. Microsoft Bing tērzēšana, piemēram, sniedza mums vairākas dīvainas un faktiski nepareizas atbildes mūsu pirmajā demonstrācijā. Saskaroties ar jautājumu, ko LLM nesaprot, tas bieži vien veido atbildi, mēģinot apmierināt vaicājumu. NeMo Guardrails mērķis ir apturēt šīs izdomātās atbildes.

Ieteiktie videoklipi

Drošības un drošības principi ir vērsti uz to, lai filtrētu nevēlamas atbildes no LLM un novērstu to, ka lietotāji ar to spēlējas. Kā mēs jau redzējām, jūs varat jailbreak ChatGPT un citi AI tērzēšanas roboti. NeMo Guardrails pieņems šos vaicājumus un neļaus tiem sasniegt LLM.

Lai gan NeMo Guardrails ir izveidots, lai tērzēšanas roboti būtu aktuāli un precīzi, tas nav visaptverošs risinājums. Nvidia saka, ka tā vislabāk darbojas kā otrā aizsardzības līnija, un uzņēmumiem, kas izstrādā un izvieto tērzēšanas robotus, joprojām ir jāapmāca modelis attiecībā uz drošības pasākumu kopumu.

Arī izstrādātājiem ir jāpielāgo rīks, lai tas atbilstu viņu lietojumprogrammām. Tas ļauj NeoMo Guardrails izmantot starpprogrammatūru, ko AI modeļi jau izmanto, piemēram, LangChain, kas jau nodrošina ietvaru, kā AI tērzēšanas robotiem vajadzētu mijiedarboties ar lietotājiem.

Papildus tam, ka tā ir atvērtā koda, Nvidia kā daļu no tā piedāvā arī NeMo Guardrails AI Foundations pakalpojums. Šī pakotne nodrošina vairākus iepriekš apmācītus modeļus un ietvarus uzņēmumiem, kuriem nav laika vai resursu, lai apmācītu un uzturētu savus modeļus.

Redaktoru ieteikumi

Lūk, kāpēc cilvēki domā, ka GPT-4 laika gaitā varētu kļūt muļķīgāks
ChatGPT: jaunākās ziņas, strīdi un padomi, kas jums jāzina
Kas ir DAN uzvedne ChatGPT?
Wix izmanto ChatGPT, lai palīdzētu ātri izveidot visu vietni
Google Bard tagad var runāt, bet vai tas var noslāpēt ChatGPT?

Uzlabojiet savu dzīvesveiduDigitālās tendences palīdz lasītājiem sekot līdzi steidzīgajai tehnoloģiju pasaulei, izmantojot visas jaunākās ziņas, jautrus produktu apskatus, ieskatu saturošus rakstus un unikālus ieskatus.

Nvidia Guardrails novērš lielu problēmu ar AI tērzēšanas robotiem

Redaktoru ieteikumi

Kategorijas

Nesen

Borderlands 3 būs Epic Games-Store ekskluzīvs personālajā datorā

Fitbit vēlas noskaidrot, vai valkājamie piederumi var noteikt koronavīrusu

PS5 reklāma nodrošina programmas Horizon: Forbidden West palaišanas logu