Nvidia Guardrails novērš lielu problēmu ar AI tērzēšanas robotiem

Nvidia ievieš savu jauno NeMo Guardrails rīku AI izstrādātājiem, un tas sola izveidot tādus AI tērzēšanas robotus kā ChatGPT tikai nedaudz mazāk ārprātīgs. Atvērtā pirmkoda programmatūra tagad ir pieejama izstrādātājiem, un tā koncentrējas uz trim jomām, lai padarītu AI tērzēšanas robotus noderīgākus un mazāk satraucošus.

Rīks atrodas starp lietotāju un lielo valodu modeli (LLM), ar kuru viņi mijiedarbojas. Tā ir drošība tērzēšanas robotiem, pārtverot atbildes, pirms tie sasniedz valodas modeli, lai apturētu modeļa reakciju vai sniegtu tai konkrētus norādījumus par to, kā reaģēt.

Bing Chat saka, ka vēlas būt cilvēks.
Jēkabs Ročs / Digitālās tendences

Nvidia saka, ka NeMo Guardrails koncentrējas uz aktuālām, drošības un drošības robežām. Šķiet, ka visnoderīgākais ir aktuālais fokuss, jo tas liek LLM palikt noteiktā atbilžu diapazonā. Nvidia demonstrēja Guardrails, parādot tērzēšanas robotu, kas apmācīts uzņēmuma personāla datu bāzē. Kad tika uzdots jautājums par Nvidia finansēm, tā sniedza gatavu atbildi, kas tika ieprogrammēta ar NeMo Guardrails.

Saistīts

  • Labākie autori pieprasa samaksu no AI firmām par viņu darba izmantošanu
  • GPT-4: kā izmantot AI tērzēšanas robotu, kas padara ChatGPT kaunā
  • Nvidia nevēlas, lai jūs zinātu par tās pretrunīgi vērtēto jauno GPU

Tas ir svarīgi daudzo tā saukto halucināciju dēļ, ko esam redzējuši no AI tērzēšanas robotiem. Microsoft Bing tērzēšana, piemēram, sniedza mums vairākas dīvainas un faktiski nepareizas atbildes mūsu pirmajā demonstrācijā. Saskaroties ar jautājumu, ko LLM nesaprot, tas bieži vien veido atbildi, mēģinot apmierināt vaicājumu. NeMo Guardrails mērķis ir apturēt šīs izdomātās atbildes.

Ieteiktie videoklipi

Drošības un drošības principi ir vērsti uz to, lai filtrētu nevēlamas atbildes no LLM un novērstu to, ka lietotāji ar to spēlējas. Kā mēs jau redzējām, jūs varat jailbreak ChatGPT un citi AI tērzēšanas roboti. NeMo Guardrails pieņems šos vaicājumus un neļaus tiem sasniegt LLM.

Nvidia NeMo Guardrails rīka diagramma.

Lai gan NeMo Guardrails ir izveidots, lai tērzēšanas roboti būtu aktuāli un precīzi, tas nav visaptverošs risinājums. Nvidia saka, ka tā vislabāk darbojas kā otrā aizsardzības līnija, un uzņēmumiem, kas izstrādā un izvieto tērzēšanas robotus, joprojām ir jāapmāca modelis attiecībā uz drošības pasākumu kopumu.

Arī izstrādātājiem ir jāpielāgo rīks, lai tas atbilstu viņu lietojumprogrammām. Tas ļauj NeoMo Guardrails izmantot starpprogrammatūru, ko AI modeļi jau izmanto, piemēram, LangChain, kas jau nodrošina ietvaru, kā AI tērzēšanas robotiem vajadzētu mijiedarboties ar lietotājiem.

Papildus tam, ka tā ir atvērtā koda, Nvidia kā daļu no tā piedāvā arī NeMo Guardrails AI Foundations pakalpojums. Šī pakotne nodrošina vairākus iepriekš apmācītus modeļus un ietvarus uzņēmumiem, kuriem nav laika vai resursu, lai apmācītu un uzturētu savus modeļus.

Redaktoru ieteikumi

  • Lūk, kāpēc cilvēki domā, ka GPT-4 laika gaitā varētu kļūt muļķīgāks
  • ChatGPT: jaunākās ziņas, strīdi un padomi, kas jums jāzina
  • Kas ir DAN uzvedne ChatGPT?
  • Wix izmanto ChatGPT, lai palīdzētu ātri izveidot visu vietni
  • Google Bard tagad var runāt, bet vai tas var noslāpēt ChatGPT?

Uzlabojiet savu dzīvesveiduDigitālās tendences palīdz lasītājiem sekot līdzi steidzīgajai tehnoloģiju pasaulei, izmantojot visas jaunākās ziņas, jautrus produktu apskatus, ieskatu saturošus rakstus un unikālus ieskatus.