11-06-2024

Immuta kondigt Multi-Layered Data Governance aan voor RAG-gebaseerde GenAI-applicaties

Deel dit bericht

Immuta heeft data governance en audit mogelijkheden aangekondigd voor Retrieval Augmented Generation (RAG) gebaseerde GenAI oplossingen op meerdere cloudplatformen. Met de release is Immuta biedt een meerlaagse architectuur voor het beveiligen, monitoren en auditen van gevoelige data waartoe RAG-gebaseerde AI-applicaties toegang hebben.

Uit een recent onderzoek van Immuta blijkt dat 80 procent van de data-experts het ermee eens is dat AI de beveiliging van gegevens uitdagender maakt. Desondanks zegt 88 procent ook dat hun werknemers AI gebruiken, ongeacht of het bedrijf het officieel heeft ingevoerd. Dit kan leiden tot wrijving tussen AI-gebruikers en IT, maar ook tot malafide of ongesanctioneerd gebruik van AI-tools. Om deze problemen te voorkomen moet het toegangscontrolebeleid worden uitgebreid, met verdedigingslinies over de opslaglaag, gegevenslaag en promptlaag.

Op RAG gebaseerde toepassingen beginnen meerdere bedrijfstakken te transformeren, zoals klantenservice, met zeer effectieve gepersonaliseerde chatbots voor klantondersteuning en detailhandel met slimme aanbevelingssystemen. Met meer schaalbare native controles kunnen data professionals en data stewards het risico van hun gegevens verlagen en de controle nemen over generatieve AI-beveiliging op de opslag- en datalagen. Dit betekent dat datateams gebruik kunnen maken van bestaand gegevensbeleid in de cloud en sneller kunnen innoveren met AI, terwijl ze de risico's op afstand houden.

Ongestructureerde data
De opslaglaag en eerste verdedigingslinie is waar ongestructureerde data bewaard worden, meestal in Amazon S3, ADLS of Google Storage. Immuta heeft samengewerkt met AWS om een native Amazon S3 integratie te ontwikkelen die een fijnmazige en schaalbare toegangscontrole afdwingt op ongestructureerde data opgeslagen in S3. Met Immuta worden attribuutgebaseerde toegangscontroles (ABAC) naar de opslaglaag geduwd, wat cruciaal is voor het beveiligen van de eerste verdedigingslinie.

De gegevenslaag en tweede verdedigingslinie is waar ongestructureerde gegevens worden getransformeerd voor modeltraining en gecodeerd voor RAG-gebruiksgevallen. Door gebruik te maken van RAG kunnen grote taalmodellen (LLM's) gebruik maken van domeinspecifieke kennisbronnen, wat de tijdigheid verbetert en hallucinaties vermindert. De vectorindexen, die centraal staan in toepassingen die gebruik maken van RAG, kunnen worden ontdekt, geclassificeerd en gecontroleerd op dezelfde manier als andere, traditionele gegevensbronnen.

Partners