Scopul acestui program este de a crea benchmarkuri care să stabilească standarde clare pentru performanța modelelor IA, reflectând mai bine utilizările din lumea reală. Conform unui comunicat al companiei, OpenAI își propune să îmbunătățească impactul IA în diverse industrii, inclusiv domeniile legal, financiar, asigurări, sănătate și contabilitate, scrie TechCrunch.
Contextul și necesitatea unui nou tip de evaluare pentru IA
Pe măsură ce adoptarea inteligenței artificiale accelerează în multe sectoare, OpenAI consideră că este esențial să se creeze evaluări specifice pentru fiecare domeniu. Aceste evaluări vor ajuta echipele să măsoare performanța modelelor IA în medii concrete, cu mize mari, ajutându-le să înțeleagă mai bine impactul acestor tehnologii. De asemenea, programul va contribui la dezvoltarea unor benchmarkuri care să…