IBM išleidžia naujus „Granite Foundation“ modelius pagal „leistiną“ „Apache“ licenciją

IBM išleidžia naujus „Granite Foundation“ modelius pagal „leistiną“ „Apache“ licenciją



Siekdama sukurti išskirtinę poziciją įmonės dirbtinio intelekto srityje, IBM Corp. šiandien pristato daugybę naujų kalbų modelių ir įrankių, kad užtikrintų atsakingą jų naudojimą.

Bendrovė taip pat pristato naujos kartos „watsonx Code Assistant“, skirtą taikomųjų programų kūrimui ir modernizavimui. Visos šios naujos galimybės yra sujungtos į kelių modelių platformą, kuria galės naudotis 160 000 bendrovės konsultantų.

Naujieji Granite 3.0 8B ir 2B modeliai yra „Instruct“ ir „Guardian“ variantai, naudojami atitinkamai treniruotėms ir rizikos / žalos aptikimui. Abi bus prieinamos pagal „Apache 2.0“ licenciją. Robas Thomasas (nuotraukoje), IBM programinės įrangos vyresnysis viceprezidentas ir vyriausiasis komercijos pareigūnas, pavadino „leidžiamiausia licencija įmonėms ir partneriams kurti papildomai vertei“. Atvirojo kodo licencija leidžia modelius diegti vos už 100 USD vienam serveriui, o intelektinės nuosavybės atlyginimas skirtas suteikti įmonės klientams pasitikėjimo sujungti savo duomenis su IBM modeliais.

„Iš „pliuso AI“ pasaulio, kuriame klientai vykdė savo verslą ir prie jo pridėjo dirbtinį intelektą, perėjome prie AI sampratos, ty įmonės, kuriančios savo verslo modelį remiantis DI“, – sakė Thomas. IBM ketina pirmauti AI naudojime informacinių technologijų automatizavimui, organiškai plėtodama ir įsigydama į infrastruktūrą orientuotas įmones, tokias kaip Turbonomic Inc., Apptio Inc. ir HashiCorp Inc.

„Verslo knyga, kurią sukūrėme naudojant generatyvųjį dirbtinį intelektą, dabar kainuoja 2 milijardus dolerių plius technologijų ir konsultacijų srityje“, – sakė Thomas. „Nesu tikras, ar kada nors turėjome verslą, kuris plėtėsi tokiu tempu.

Treniruotėms naudojamos „Granite“ „Instruct“ versijos yra 8 milijardų ir 2 milijardų parametrų versijos. Jie buvo išmokyti naudoti daugiau nei 12 trilijonų mokymo duomenų žetonų 12 kalbų ir 116 programavimo kalbų, todėl jie galėjo koduoti, dokumentuoti ir versti.

IBM teigė, kad iki metų pabaigos ji planuoja išplėsti pagrindinius modelius iki 128 000 žetonų konteksto ilgio su daugiarūšiu režimu. Tai reiškia, kad pagerinamas modelio gebėjimas apdoroti žymiai ilgesnes įvesties sekas ir vienu metu apdoroti kelių tipų duomenis. Konteksto ilgis yra žetonų (pvz., žodžių, simbolių ir (arba) kitų įvesties duomenų vienetų), kuriuos AI modelis gali apdoroti ir išsaugoti, skaičius. Įprastų modelių konteksto ilgis yra nuo 1 000 iki 8 000 žetonų.

Įmonės darbiniai arkliai

IBM teigė, kad naujieji „Granite“ modeliai yra sukurti kaip įmonės „darbiniai arkliukai“ tokioms užduotims kaip paieškos papildyta generacija arba RAG, klasifikavimas, apibendrinimas, agentų mokymas, objektų išgavimas ir įrankių naudojimas. Jie gali būti mokomi naudojant įmonės duomenis, kad būtų užtikrintas konkrečioms užduotims būdingas daug didesnių modelių našumas iki 60 kartų mažesnėmis sąnaudomis. Vidiniai etalonai parodė, kad „Granite 8B“ modelio našumas geresnis nei palyginamų „Google LLC“ ir „Mistral AI SAS“ modelių, o lygiavertis panašiems „Meta Platforms Inc.“ modeliams.

Pridedamoje techninėje ataskaitoje ir atsakingo naudojimo vadove pateikiama išsami mokymo duomenų rinkinių, naudojamų modeliams mokyti, dokumentacija, taip pat išsami informacija apie taikytas filtravimo, valymo ir priežiūros veiksmus bei lyginamieji duomenys.

Atnaujintas iš anksto paruoštų Granite modelių leidimas, kurį IBM išleido anksčiau šiais metais, apmokytas tris kartus daugiau duomenų ir suteikia didesnį modeliavimo lankstumą, palaikydamas išorinius kintamuosius ir slenkančias prognozes.

„Granite Guardian 3.0“ modeliai yra skirti saugos apsaugai užtikrinti, tikrinant naudotojų raginimus ir modelio atsakymus dėl įvairių pavojų. „Galite sujungti tiek įvestį, tiek prieš pateikdami išvados užklausą, ir išvestį, kad išvengtumėte pagrindinio modelio įsilaužimo į kalėjimą ir išvengtumėte smurto, nešvankybių ir kt.“, – sakė IBM vyresnysis viceprezidentas ir tyrimų direktorius Dario Gilas. „Padarėme viską, kas įmanoma, kad tai būtų kuo saugesnė.

„Jailbreak“ yra kenkėjiški bandymai apeiti AI sistemai taikomus apribojimus ar saugos priemones, kad ji veiktų nenumatytu arba potencialiai žalingu būdu. „Guardian“ taip pat atlieka konkrečias RAG patikras, pvz., konteksto tinkamumą, atsakymo tinkamumą ir „pagrįstumą“, o tai reiškia, kiek modelis yra prijungtas prie realaus pasaulio duomenų, faktų ar konteksto ir yra jais informuotas.

AI pakraštyje

Mažesnių modelių rinkinys, pavadintas „Granite Accelerators and Mixture of Experts“, yra skirtas mažos delsos ir tik procesoriaus programoms. MoE yra mašininio mokymosi architektūros tipas, kuris sujungia kelis specializuotus modelius ir dinamiškai parenka bei suaktyvina tik dalį jų, kad padidintų efektyvumą.

„Akseleratorius leidžia įgyvendinti spekuliacinį dekodavimą, kad galėtumėte pasiekti dvigubai didesnį pralaidumą nei pagrindinis modelis neprarandant kokybės“, – sakė Gil. MoE modelis gali būti apmokytas naudojant 10 trilijonų žetonų, tačiau jis naudoja tik 800 milijonų, naudojamų atliekant išvadas, kad būtų galima efektyviau naudoti kraštutiniais atvejais.

Granite 8B ir 2B modelių „Instruct“ ir „Guardian“ variantai iš karto pasiekiami komerciniam naudojimui IBM „watsonx“ platformoje. Granite 3.0 modelių pasirinkimas taip pat bus prieinamas partnerių platformose, pvz., Nvidia Corp. NIM stack ir Google Vertex. Visą Granite 3.0 modelių rinkinį ir atnaujintus Time Series modelius galima atsisiųsti iš HuggingFace Inc. atvirojo kodo platformos ir Red Hat Enterprise Linux.

Naujasis „Granite 3.0“ pagrindu sukurtas „watsonx Code Assistant“ palaiko C, C++, Go, Java ir Python kalbas su naujomis įmonių Java taikomųjų programų modernizavimo galimybėmis. IBM teigė, kad asistentas sukūrė 90 % greitesnį kodo dokumentavimą tam tikroms programinės įrangos kūrimo verslo užduotims. Kodo galimybes galima pasiekti naudojant „Visual Studio Code“ plėtinį, vadinamą IBM Granite.Code.

Daugiau geresnių agentų

Nauji kūrėjams skirti įrankiai apima agentų sistemas, integraciją su esamomis aplinkomis ir mažo kodo automatizavimą, skirtą įprastam naudojimui, pvz., RAG ir agentams.

Kadangi agentinis AI arba sistemos, galinčios savarankiškai elgtis arba priimti sprendimus, taps kita didele AI plėtros banga, IBM taip pat pranešė, kad savo konsultacijų padalinį aprūpina daugiarūše agentų platforma. Naujosiose „Consulting Advantage for Cloud Transformation and Management“ ir „Consulting Advantage for Business Operations“ konsultacinėse linijose bus su domenu susiję AI agentai, programos ir metodai, apmokyti IBM intelektinės nuosavybės ir geriausios praktikos, kurią konsultantai gali pritaikyti savo klientų debesies ir AI projektams, klausimais.

Maždaug 80 000 IBM konsultantų šiuo metu naudojasi „Consulting Advantage“, dauguma jų vienu metu siunčia tik vieną ar du agentus, sakė „IBM Consulting“ vyresnysis viceprezidentas Mohamadas Ali. Tačiau augant naudojimui, „IBM Consulting“ turės palaikyti daugiau nei 1,5 mln. agentų, todėl „Granite“ ekonomika yra „neabejotinai svarbi, nes mes ir toliau didinsime šios platformos mastą ir turime būti labai ekonomiški“, – sakė jis.

Nuotrauka: SiliconANGLE

Jūsų balsas už paramą mums yra svarbus ir padeda mums išlaikyti turinį NEMOKAMĄ.

Vienu spustelėjimu toliau palaikome mūsų misiją teikti nemokamą, išsamų ir aktualų turinį.

Prisijunkite prie mūsų bendruomenės „YouTube“.

Prisijunkite prie bendruomenės, kurią sudaro daugiau nei 15 000 #CubeAlumni ekspertų, įskaitant Amazon.com generalinį direktorių Andy Jassy, ​​„Dell Technologies“ įkūrėją ir generalinį direktorių Michaelą Delą, „Intel“ generalinį direktorių Patą Gelsingerį ir daugybę kitų šviesuolių bei ekspertų.

„TheCUBE yra svarbus pramonės partneris. Jūs, vaikinai, tikrai esate mūsų renginių dalis ir mes labai vertiname, kad atėjote, ir aš žinau, kad žmonės taip pat vertina jūsų kuriamą turinį“ – Andy Jassy

AČIŪ



Source link

Draugai: - Marketingo agentūra - Teisinės konsultacijos - Skaidrių skenavimas - Fotofilmų kūrimas - Miesto naujienos - Šeimos gydytojai - Saulius Narbutas - Įvaizdžio kūrimas - Veidoskaita - Nuotekų valymo įrenginiai - Teniso treniruotės - Pranešimai spaudai -